Pāriet uz saturu

Beiesa teorēma

Vikipēdijas lapa

Beiesa teorēma, arī Beiesa formula, ir viena no pamatteorēmām elementārās varbūtības teorijā, ar kuras palīdzību var noteikt kaut kāda notikuma varbūtību iespējamību, ar noteikumu, ja ir zināms, ka ir noticis cits notikums, kas ir statistiski savstarpēji atkarīgs no tā. Citiem vārdiem sakot, pēc Beijesa formulas var daudz precīzāk aprēķināt varbūtības, ņemot vērā gan iepriekš zināmu informāciju, gan arī jauniegūtos novērojuma datus. Beiesa formulu var izteikt no galvenajām varbūtību teorijas pamata aksiomām, galvenokārt no nosacītās varbūtības. Beiesa teorēmas specifiskā iezīme ir tāda, ka tās praktiskajā pielietojumā ir vajadzīgs liels skaits datu un aprēķinu, tāpēc Beiesa teorēmas aprēķinus aktīvi sāka izmantot tikai pēc revolūcijas datoru un tīklu tehnoloģijās.

Parādoties Beiesa teorēmai, tās izmantotās varbūtības tika pakļautas vairākām iespējamām interpretācijām. Vienā no šīm interpretācijām tiek teikts, ka formulas atvasinājums ir tieši saistīts ar tās izmantošanu speciālai pieejai statistiskajai analīzei. Ja izmanto Beiesa varbūtības teorijas interpretāciju, tad teorēma parāda, kā personīgais uzticības līmenis var ievērojami mainīties notikušo notikumu skaita dēļ. Tie arī ir Beiesa secinājumi, kas ir kļuvuši par fundamentu Beiesa statistikai. Tomēr teorēmu lieto ne tikai Beiesa analīzē, bet to arī aktīvi izmanto daudzos citos aprēķinos.

Psiholoģiskie eksperimenti parādīja, ka cilvēki bieži nepareizi novērtē notikuma varbūtību, viņi pamatojas uz gūto pieredzi, jo ignorē pašu iespējas varbūtību.[1] Tādēļ pareizais rezultāts, izmantojot Beiesa formulu, var ļoti atšķirties no intuitīvi gaidāmā rezultāta.

Beiesa teorēma ir nosaukta par godu tā autoram Tomasam Beiesam (1702—1761), angļu matemātiķim un mācītājam, kurš pirmo reizi ierosināja izmantot šo teorēmu, lai koriģētu uzskatus, pamatojoties pēc atjauninātajiem datiem. Viņa darbs «An Essay towards solving a Problem in the Doctrine of Chances» pirmo reizi tika publicēts 1763. gadā,[2] 2 gadus pēc autora nāves. Pirms Beiesa darbu pieņēma un izlasīja Karaliskā sabiedrība, to ievērojami rediģēja un atjaunināja Ričards Praiss. Tomēr šīs idejas netika publiskotas līdz brīdim, kamēr tās atkal neatklāja un neizstrādāja Laplass, kas pirmo reizi publicēja mūsdienu teorēmas formulējumu savā 1812. gada grāmatā "Analītiskās varbūtības teorija".

Sers Harolds Džefrijs rakstīja, ka Beiesa teorēma "varbūtības teorijai ir tāda pati, kā Pitagora teorēma ģeometrijai".

,

kur

- apriorā hipotēzes A varbūtība

- hipotēzes A varbūtība, ja izpildās B

- varbūtība B notikuma notikšanai, ja ir patiesa hipotēze A

- pilnīgā varbūtība notikuma B izpildīšanai.

Beiesa formula izriet no nosacījuma varbūtības definīcijas. Vienota notikuma AB varbūtība ir izteikta divos veidos, izmantojot nosacījuma varbūtības.

Tādēļ

Aprēķini

[labot šo sadaļu | labot pirmkodu]

Uzdevumos un statistikas lietojumos P(B) parasti aprēķina pēc pilnīgās notikumu varbūtības formulas, kas ir atkarīga no vairākām nesaderīgām hipotēzēm, kuru kopējā varbūtība ir 1.

,

kur ir zināmas varbūtības zem summas zīmes vai pieļauj to eksperimentāli novērtēt.

Tādā gadījumā, Beiesa formulu raksta:

"Fiziskā nozīme" un terminoloģija

[labot šo sadaļu | labot pirmkodu]

Beiesa formula ļauj "pārkārtot cēloņus un sekas": no zināmā notikuma fakta aprēķināt varbūtību, ka to izraisījis kāds cēlonis.

Šajā gadījumā notikumus, kas atspoguļo "cēloņu" darbību, sauc par hipotēzēm, jo tie ir iespējamie notikumi, kas to izraisīja. Par pilnīgāko varbūtības hipotēzes taisnīgumu sauc apriori (cik vispār ir iespējams šis notikums), bet nosacīto, ņemot vērā notikušo notikumu, sauc par a posteriori (cik liela varbūtība izrādījās, ņemot vērā notikuma datus).

Kā piemēram, notikums B būs — automašīnu nevar iedarbināt, un hipotēze A — tvertnē nav degvielas. Acīmredzams, varbūtība , ka mašīnu nevarēs iedarbināt, ja tvertnē nav degvielas, ir vienāda ar viens. Līdz ar to a posteriori varbūtība, ka tvertnē nav degvielas, ja automašīnu nevar iedarbināt, kas ir ir vienāda ar , kas nozīmē, ka apriori varbūtība, ka tvertnē nav degvielas, attiecība pret varbūtību, ka mašīnu nevar iedarbināt. Piemēram, ja iepriekšējā varbūtība, ka tvertnē nav degvielas, ir 1%, un varbūtība, ka automašīna nedarbosies, ir 2%, un nejauši izvēlēta automašīna neiedarbināsies, tad varbūtība, ka tvertnē nav degvielas, ir 50%.

Brāķa varbūtība pirmajam strādniekam ir , otrajam strādniekam — un trešajam strādniekam — . Pirmais izgatavoja detaļas , otrais — detaļas un trešais — detaļas. Rūpnīcas vadītājs paņem pēc nejaušības principa vienu detaļu un izrādās, ka tā ir brāķis. Jautājums ir — cik liela varbūtība, ka šo detaļu ir izgatavojis trešais darbinieks?

Notikums  — detaļas brāķis, notikums — detaļu izgatavoja strādnieks . Tad , kur , bet .

Pēc pilnīgās varbūtības formulas:

Pēc Beiesa formulas mēs iegūsim:

Koka diagramma parāda biežuma piemēru. R, C, P un P ar domuzīmi ir notikumi, kas norāda, ka vabole ir reta, parasta, ar rakstu un bez raksta. Aprēķina procentus iekavās. Ņemiet vērā, ka tiek dotas trīs neatkarīgo notikumu vērtības, tāpēc ir iespējams aprēķināt apgriezto koku (skat. iepriekšējo grafiku)

Entomologs domā, ka, iespējams, vabole var piederēt pie retas sugas, jo uz tās ķermeņa ir īpaši raksti. Retās sugās 98% vaboļu ir raksti vai P (Raksti | Rets) = 0,98 (P (Pattern | Rare) = 0,98). Starp parastajām vabolēm tikai 5% ir šādi raksti. Retas kukaiņu sugas ir tikai 0,1% no visas populācijas. Kāda ir varbūtība, ka vabole ar rakstu pieder pie reta apakštipa vai P (Rets | Raksti) (P (Rare| Pattern))?

No paplašinātās Beiesa teorēmas iegūstam (jebkurš kukainis var piederēt vai nu pie retas vai parastas (Common) sugas):

4. piemērs — Beiesa teorēmas paradokss

[labot šo sadaļu | labot pirmkodu]

Pieņemsim, ka ir slimība ar izplatības biežumu starp iedzīvotājiem 0,001 un diagnostiskās pārbaudes metode, kas ar 0,9 varbūtību pareizi identificē slimu cilvēku, bet tajā pašā laikā ir varbūtība 0,01 kļūdaini noteikt slimību veselam cilvēkam. Atrodiet varbūtību, ka persona ir vesela, ja tā tika atzīta par slimu pārbaudes laikā.

Apzīmēsim ar B — gadījums, kad persona slimo, „B” ir notikums, ka pārbaude parādīja, ka persona ir slima, un Z — notikums, kad persona ir vesela. Tad norādītie nosacījumi tiek pārrakstīti šādi:

P(«B» | B) = 0,9;
Р(«B» | Z)= 0,01;
Р(B) = 0,001, tātad P(Z) = 0,999.

Varbūtība, ka cilvēks ir vesels, ja viņš bija atzīts par slimu, vienāda ar nosacīto varbūtību:

Р(Z | «B»).

Lai to atrastu, aprēķināsim vispirms pilnīgo varbūtību, kad cilvēks atzīts par slimu:

Р(«B») = 0,999 × 0,01 + 0,001 × 0,9 = 1,089 %.

Varbūtība, ka cilvēks tomēr ir vesels, ja ir rezultāts "slims":

Р(Z | «B») = 0,999 × 0,01 / (0,999 × 0,01 + 0,001 × 0,9) ≈ 91,7 %.

Tādējādi 91,7% cilvēku, kuriem diagnostika parādīja rezultātu „slims”, ir faktiski veseli cilvēki. Iemesls tam ir tāds, ka saskaņā ar uzdevuma nosacījumiem viltus pozitīvā rezultāta varbūtība gan ir maza, bet tomēr par kārtu (desmit reizes) lielāka, nekā slimo cilvēku daļa pētāmajā cilvēku grupā.

Ja diagnostikas kļūdainos rezultātus var uzskatīt par nejaušiem, tad vienas un tās pašas personas atkārtota pārbaude sniegs no pirmās neatkarīgu rezultātu. Šajā gadījumā, lai samazinātu viltus pozitīvo rezultātu iespējamību, ir lietderīgi vēlreiz pārbaudīt cilvēkus, kuri ir saņēmuši rezultātu "slimi". Varbūtību, ka cilvēks ir vesels pēc rezultāta “slims” iegūšanas, var aprēķināt arī pēc Beiesa formulas: Р(Z| «B», «B») = 0,999 × 0,01 × 0,01 / (0,999 × 0,01 × 0,01 + 0,001 × 0,9 × 0,9) ≈ 10,98 %.

Varbūtību interpretācijas varianti Beiesa teorēmā

[labot šo sadaļu | labot pirmkodu]

Matemātiski Beiesa teorēma parāda attiecību starp notikuma A varbūtību un notikuma B, P (A) un P (B) varbūtību, notikuma A nosacīto varbūtību iestāšanās, eksistējot notikumam B, un notikuma B iestāšanās, ja notiek A, P (A | B) un P (B) | A).

Kopējā formā Beiesa formula izskatās šādi:

Izteiksmes nozīme atkarīga no tā, kā interpretējas varbūtība dotajā formulā.

Beiesa interpretācijas

[labot šo sadaļu | labot pirmkodu]

Beiesa interpretācijā varbūtība mēra ticamības līmeni. Beiesa teorēma apvieno pieņēmumu ticamību līdz un pēc vērā ņemamiem pierādījumu. Piemēram, kāds pieņēma, ka, izmetot monētu, tā izkrīt divas reizes biežāk ar skaitli augšup. Sākotnēji ticamības pakāpe, ka šāds notikums notiks jeb monēta nokritīs ar ciparu uz augšu — 50%. Uzticības līmenis var palielināties līdz 70%, ja pieņēmumu apstiprina pierādījumi.

Pieņēmumiem (hipotēzēm) A un pierādījumiem B

  • P(A) — apriora hipotēzes varbūtība A, sākotnējais ticamības pieņēmums A;
  • P(A | B) — a posterior hipotēzes varbūtība A, notiekot notikumam B;
  • attiecība P(B | A)/P(B) parāda, kā notikums B palīdz mainīt pieņēmuma ticamības līmeni A.
Frekvenču interpretācijas ilustrācija

Frekvenču interpretācija

[labot šo sadaļu | labot pirmkodu]

Frekvenču interpretācijā Beiesa teorēma fiksē notikušo notikumu skaitu (iespējas) un nosaka to varbūtību. Piemēram, pieņemsim, ka eksperiments tika veikts vairākas reizes. P (A) ir notikumu A reižu skaits, kas noticis (mērīts daļās). P (B) ir notikumu B reižu skaits, kas noticis (mērīts daļās). P (B | A) ir notikuma “B” rašanās biežums (daļās) nenotiekot notikumam A. P (A | B) ir notikuma A rašanās nenotiekot notikumam B.

Beiesa teorēmas nozīmi vislabāk var saprast no diagrammas labajā pusē. Abas diagrammas parāda notikumus A un B ar pozitīviem un negatīviem rezultātiem, lai parādītu visus varbūtību iznākumus. Beiesa teorēmu izmanto kā saikni starp šīm dažādajām daļām.

Notikumiem A un B, ar nosacījumu, ka P(B) ≠ 0,

Daudzi Beiesa teorēmas papildinājumi norāda, ka notikums B ir zināms un nepieciešams saprast, kā zināšanas par notikumu B ietekmē pārliecību, ka notikums A notiks. Tādā gadījumā pēdējā gadījumā saucējs ir — notikuma B iespējamība — zināms; mēs vēlamies mainīt A. Beiesa teorēma parāda, ka a posteriori varbūtības ir proporcionālas skaitītājam:

(proporcionalitāte "A dotajam B").

Ja notikumi A1, A2, … ir savstarpēji izslēdzoši un izsmeļoši, tas ir, tikai viens no notikumiem ir iespējams,vienā un tajā pašā laikā divi notikumi nevar notikt kopā, mēs varam noteikt proporcionalitātes koeficientu, orientējoties uz to, ka to kopējā varbūtības summa ir viens. Piemēram, konkrētam notikumam A — notikums A un tā pretējais notikums ¬A, ir savstarpēji izslēdzoši un izsmeļoši. Norādot proporcionalitātes koeficientu kā C, mums ir:

un

Apvienojot abas formulas, mēs iegūstam:

Paplašinātā forma

[labot šo sadaļu | labot pirmkodu]

Bieži vien notikumu telpa (tādu kā {Aj}) noteikti terminos P(Aj) и P(B | Aj). Tieši šajā gadījumā ir labi noteikt P(B), pielietojot pilnīgo varbūtības teorēmu:

Jo īpaši:

Diagramma atspoguļo Beiesa teorēmas nozīmi un ir piemērojama notikumu telpai, ko veido nepārtraukti nejaušie mainīgie X un Y. Ņemiet vērā, ka pēc Beiesa teorēmas ir prasības katram telpas punktam. Praksē šīs prasības var attēlot parametru formā, izmantojot sadalījuma blīvuma apzīmējumu kā x un y funkciju

Nepārtrauktie nejaušie mainīgie

[labot šo sadaļu | labot pirmkodu]

Izskatīsim elementāro notikumu telpu Ω, ko veido divi daudzumi X un Y. Principā Beiesa teorēmu pielieto notikumiem A = {X = x} un B = {Y = y}. Tomēr izteiksmes kļūst vienādas ar 0 vietās, kur mainīgajam ir ierobežots varbūtības blīvums. Lai turpinātu lietderīgi izmantot Beiesa teorēmu, to var formulēt piemērotu blīvuma izteiksmē.

Ja X nepārtraukta un Y diskrēta, tad

Ja X diskrēts un Y nepārtraukta,

Ja gan X, gan Y nepārtraukti,

Diagramma, kas parāda, ka telpas varbūtības, ko veido nepārtraukti nejauši mainīgie lielumi X un Y, bieži vien nosakās

Paplašinātā forma

[labot šo sadaļu | labot pirmkodu]

Nepārtraukta notikumu telpa bieži tiek definēta kā nosacījumu A skaitītājs. Nepārtraukta notikuma telpa bieži tiek attēlota kā skaitītājs. Tālāk ir lietderīgi atbrīvoties no saucēja, izmantojot vispārējo varbūtības formulu. Priekš“fY (y), tas kļūst par integrāli:

Beiesa likums — pārveidota Beiesa teorēma:

,

kur

To sauc par Beiesa likumu vai pareizuma attiecību. Divu notikumu rašanās varbūtības atšķirība ir tikai šo divu notikumu varbūtību attiecība. Tādējādi,

,

Formulu atvasināšana

[labot šo sadaļu | labot pirmkodu]

Beiesa teorēma var būt iegūta no noteiktas varbūtības:

Nejaušiem mainīgajiem

[labot šo sadaļu | labot pirmkodu]

Attiecībā starp diviem nepārtrauktiem nejaušiem mainīgajiem lielumiem X un Y, Beiesa teorēmu var līdzīgi atvasināt no nosacītā sadalījuma definīcijas:

  1. Daniel Kahneman, et al. — 21st. — Cambridge University Press, 2005. — 555 p.
  2. «Arhivēta kopija». www.stat.ucla.edu. Arhivēts no oriģināla, laiks: 2011-04-10. Skatīts: 2019-01-03.