Natură | Teorema |
---|---|
Inventator | Thomas Bayes |
Data invenției | 1763 |
Numit cu referire la | Thomas Bayes |
Aspect al | Statistic |
Formulă |
The Bayes Teorema este una dintre principalele teoreme ale teoriei probabilității , de asemenea , utilizat în statistici , deoarece sa de punere în aplicare , care determină probabilitatea ca un eveniment vine de la un alt eveniment sa devina realitate, cu condiția ca aceste două evenimente sunt interdependente .
Cu alte cuvinte, din această teoremă, este posibil să se calculeze cu precizie probabilitatea unui eveniment luând în considerare atât informațiile deja cunoscute, cât și datele din noile observații. Formula lui Bayes poate fi derivată din axiomele de bază ale teoriei probabilității, în special probabilitatea condițională . Particularitatea teoremei lui Bayes este că aplicarea sa practică necesită un număr mare de calcule, motiv pentru care estimările bayesiene au început să fie utilizate în mod activ numai după revoluția în tehnologiile de calcul și rețea.
Formularea sa inițială a venit din lucrarea reverendului Thomas Bayes . A fost găsit independent de Pierre-Simon de Laplace . Formularea lui Bayes în 1763 este mai limitată decât noile formulări de astăzi.
Pe lângă utilizarea sa în probabilitate, această teoremă este fundamentală pentru inferența bayesiană, care s-a dovedit a fi foarte utilă în inteligența artificială . Este, de asemenea, utilizat în alte câteva domenii: în medicină, științe digitale, geografie, demografie etc.
Pentru matematicianul Harold Jeffreys , formulările lui Bayes și Laplace sunt axiome și consideră, de asemenea, că „teorema lui Bayes este teoria probabilității, ceea ce este teorema pitagoreică pentru geometrie . "
Când a murit în Aprilie 1761, Thomas Bayes lasă articolele sale neterminate lui Richard Price . Acesta din urmă a luat inițiativa de a publica articolul „ Un eseu către rezolvarea unei probleme din Doctrina șansei ” și de a-l trimite Societății Regale doi ani mai târziu.
Potrivit lui Martyn Hooper, este probabil că Richard Price însuși a contribuit semnificativ la redactarea articolului final și că el, împreună cu Thomas Bayes, a fost autorul teoremei cunoscute sub numele de teorema lui Bayes. Această eroare de atribuire ar fi o aplicație a legii eponimiei lui Stigler conform căreia descoperirile științifice sunt rareori atribuite primului lor autor.
Formula a fost redescoperită de Pierre-Simon de Laplace în 1774.
În singurul său articol, Bayes a căutat să determine ceea ce acum am numi distribuția posterioară a probabilității p a unei distribuții binomiale . Lucrarea sa a fost publicată și prezentată postum (1763) de prietenul său Richard Price într- un proces de rezolvare a unei probleme în teoria riscului ( Un eseu către soluționarea unei probleme în Doctrina șanselor ). Rezultatele lui Bayes au fost extinse într-un eseu din 1774 al matematicianului francez Laplace , care se pare că nu era familiarizat cu opera lui Bayes. Rezultatul principal obținut de Bayes este următorul: luând în considerare o distribuție uniformă a parametrului binomial p și o observație O a unei legi binomiale , unde m este deci numărul de rezultate pozitive observate și n numărul de eșecuri observate, probabilitatea ca p este între a și b știind că O este:
Aceste rezultate preliminare implică rezultatul cunoscut sub numele de teorema lui Bayes , dar nu pare că Bayes s-a concentrat sau a insistat asupra acestui rezultat.
Ce este „bayesian” (în sensul actual al cuvântului) în acest rezultat este că Bayes a prezentat acest lucru ca o probabilitate pe parametrul p . Acest lucru înseamnă a spune că putem determina nu numai probabilitățile din observațiile rezultate dintr-un experiment, ci și parametrii referitori la aceste probabilități. Este același tip de calcul analitic care permite determinarea prin inferență a celor două. Pe de altă parte, dacă ne ținem de o interpretare frecventistă (en) , ar trebui să nu luăm în considerare o probabilitate de distribuție a parametrului p și, în consecință, nu putem raționa despre p cu raționament de inferență (logic) non-probabilistic.
Din 2000, publicațiile despre acesta s-au înmulțit datorită numeroaselor aplicații.
Teorema lui Bayes este un corolar al teoremei probabilității totale . Precizează probabilitățile condiționate ale mai multor evenimente . De exemplu, pentru evenimentele A și B , face posibilă determinarea probabilității ca A să cunoască B , dacă cunoaștem probabilitățile lui A , B și B, cunoscând A , cu condiția ca probabilitatea lui B să nu fie egală cu 0.
În formularea sa din 1763, teorema a fost afirmată:
, cu condiția ca și unde:
Se mai poate scrie:
, sau:
Teorema este, de asemenea, reformulată pentru a integra funcția de probabilitate marginală (en) ( funcția de probabilitate care integrează constanta de normalizare (en) ). Este formulat după cum urmează:
Într-un univers , partițiile unui set (adică și ), probabilitatea condiționată de evenimente reciproc excluzive și exhaustive ( ), cu condiția ca , cunoașterea să fie calculată:
, sau:
Calculul depinde de domeniul său de aplicare. În științele digitale , se numește „dovadă” pentru a desemna funcția de probabilitate marginală și aplicată în medicină , desemnează un raport de probabilitate .
Se mai poate scrie:
și :
, sau:
De exemplu, imaginați-vă două urne umplute cu bile. Prima conține zece (10) bile negre și treizeci (30) de bile albe; al doilea are douăzeci (20) din fiecare. Una dintre urne este extrasă la întâmplare fără preferință specială și în această urnă, o minge este extrasă la întâmplare. Mingea este albă. Care este probabilitatea ca această minge să fie trasă în prima urnă știind că este albă?
Intuitiv, înțelegem că este mai probabil ca această minge să provină din prima urnă, decât din a doua. Deci, această probabilitate ar trebui să fie mai mare de 50%. Răspunsul exact (60%) poate fi calculat din teorema lui Bayes.
Fie H 1 ipoteza „Tragem în prima urnă. „Și H 2 ipoteza” Tragem în a doua urnă. ". Pe măsură ce se desenează fără o preferință specială, P ( H 1 ) = P ( H 2 ); mai mult, așa cum am tras cu siguranță într-una din cele două urne, suma celor două probabilități valorează 1: fiecare valorează 50%.
Să notăm cu D informațiile date „Desenăm o bilă albă. Pe măsură ce desenăm o bilă la întâmplare într-una dintre urne, probabilitatea ca D să cunoască ipoteza H 1 efectuată este egală cu:
În mod similar, probabilitatea ca D să cunoască ipoteza H 2 efectuată merită:
Prin urmare, formula lui Bayes în cazul discret ne oferă:
Înainte de a ne uita la culoarea mingii, probabilitatea de a alege prima urnă este o probabilitate a priori , P ( H 1 ) sau 50%. După ce ne uităm la minge, ne analizăm judecata și luăm în considerare P ( H 1 | D ), sau 60%, ceea ce confirmă prima noastră intuiție.
Această teoremă elementară (numită inițial „probabilitatea cauzelor”) are aplicații considerabile.
Teorema lui Bayes este utilizată în inferența statistică pentru a actualiza sau actualiza estimările oricărei probabilități sau parametri, din observații și legile de probabilitate ale acestor observații. Există o versiune discretă și o versiune continuă a teoremei.
Regulile teoriei matematice a probabilității se aplică probabilităților ca atare, nu doar aplicării lor ca frecvențe relative ale evenimentelor aleatorii (vezi Eveniment (probabilități) ). Putem decide să le aplicăm la grade de credință în anumite propoziții. Aceste grade de credință sunt rafinate în ceea ce privește experimentele prin aplicarea teoremei lui Bayes.
Cele Cox-Jaynes Teorema astăzi justifică această abordare foarte bine, care , pentru o lungă perioadă de timp a avut fundații doar intuitive și empirice.
În Cartea de ce , Judea Pearl prezintă regula lui Bayes ca un caz special al unei rețele bayesiene cu două noduri și o legătură. Rețelele bayesiene sunt o extensie a regulii lui Bayes la rețelele mai mari.
O problemă ridicată în mod regulat de abordarea bayesiană este următoarea: dacă o probabilitate de comportament (delincvență, de exemplu) este puternic dependentă de anumiți factori sociali, culturali sau ereditari, atunci:
Statisticile au fost prezentate în mod repetat în instanțele judecătorești și, în unele cazuri, implicate în avorturi judiciare semnificative, precum cazurile lui Sally Clark sau Lucia de Berk. Formula lui Bayes a fost fie înțeleasă greșit, fie utilizată greșit. Prin urmare, procuratura a estimat că probabilitatea ca o persoană nevinovată să fie găsită vinovată în astfel de cazuri a fost mică sau aproape nulă. Abia după sentință, experții au protestat și au demonstrat că această probabilitate luată în considerare nu are sens și că, dimpotrivă, a fost necesar să se studieze cei care sunt vinovați sau nevinovați știind că a existat moartea. cifre care lasă loc pentru îndoieli legitime). În mod discret, denotăm prin sofismul procurorului aceste confuzii între probabilitățile condiționate.
Cele fals pozitive sunt o dificultate inerente în fiecare test: nici un test este perfect. Uneori rezultatul va fi incorect pozitiv, ceea ce este denumit uneori risc de prim ordin sau risc alfa .
De exemplu, atunci când testați o persoană pentru a afla dacă are o boală, există riscul, de obicei minim, ca rezultatul să fie pozitiv, chiar dacă pacientul nu a contractat boala. Problema nu este aceea de a măsura acest risc în termeni absoluți (înainte de a continua cu testul), este totuși necesar să se determine probabilitatea ca un test pozitiv să fie în mod greșit. Vom arăta cum, în cazul unei boli foarte rare, același test, care este altfel foarte fiabil, poate duce la o majoritate clară a pozitivilor ilegitimi.
Imaginați-vă un test extrem de fiabil:
Să presupunem că boala afectează o singură persoană dintr-o mie, adică cu o probabilitate de 0,001. S-ar putea să nu pară prea mult, dar în cazul unei boli fatale, este considerabilă. Avem toate informațiile de care avem nevoie pentru a determina probabilitatea ca un test să fie pozitiv în mod greșit, ceea ce poate provoca supra-diagnostic .
Notăm cu A evenimentul „Pacientul a contractat boala” și cu B evenimentul „Testul este pozitiv”. A doua formă a teoremei lui Bayes în cazul discret oferă apoi:
Tradusă în limbajul cotidian, această ecuație înseamnă că „probabilitatea ca pacientul să fi contractat efectiv boala, atunci când testul este pozitiv, este de numai 1,9%”. Știind că testul este pozitiv, probabilitatea ca pacientul să fie sănătos merită, prin urmare, aproximativ: (1 - 0,019) = 0,981. De fapt, din cauza numărului foarte mic de pacienți,
Dacă tratamentul este foarte greoi, costisitor sau periculos pentru un pacient sănătos, poate fi indicat să supunem toți pacienții pozitivi la un test complementar (care va fi, fără îndoială, mai precis și mai scump, primul test nefiind servit decât pentru a exclude cele mai evidente cazuri).
Cu toate acestea, am reușit, cu primul test, să izolăm o populație de douăzeci de ori mai mică, care conține practic toți pacienții. De fapt, prin eliminarea pacienților al căror test este negativ și care, prin urmare, ar trebui să fie sănătoși, am redus raportul pacienților la populația studiată de la unu la mie la unu la cincizeci ( P (A | B) este aproape de 1/50). Prin efectuarea altor teste, se poate spera la îmbunătățirea fiabilității detectării.
Teorema lui Bayes ne arată că, în cazul unei probabilități reduse de boală căutată, riscul de a fi declarat greșit pozitiv are un impact foarte puternic asupra fiabilității. Depistarea unei boli rare, cum ar fi cancerul, poate provoca supra-diagnostic .
Această eroare intuitivă, de estimare comună, este o prejudecată cognitivă numită „ uitarea frecvenței de bază ” .