Intuiție vs. probabilități



Autor: Bogdan Banu

2015-04-22



Exercițiu de imaginație

Să presupunem că sunteți la un concurs TV și aveți în față 3 uși închise. Una dintre ele ascunde o mașină, iar în spatele celorlalte două nu se află nimic. Nu știți unde se află mașina și alegeți la întâmplare una dintre uși. Gazda concursului, care cunoaște poziția mașinii, deschide altă ușă și vă arată că în spatele ei nu se află nimic (dacă ați ales ușa cu masina, atunci gazda deschide una dintre celelalte două la întâmplare). În final trebuie să deschideți o ușă și veți câștiga ce se află în spatele ei, iar gazda vă oferă ocazia să deschideți prima ușă aleasă sau să o deschideți pe cealaltă rămasă nedeschisă. Ce trebuie să faceți în acest moment pentru a găsi mașina, să rămâneți cu prima alegere sau să o schimbați?

Puși în fața acestei dileme, majoritatea oamenilor raționează în felul următor: au mai rămas doar două uși și șansele ca una să conțină mașina sunt egale. Deci nu contează dacă schimbă ușa.

Deși pare intuitiv, argumentul de mai sus este greșit: în mod suprinzător, dacă schimbați ușa, șansele de câștig sunt de două ori mai mari decât dacă rămâneți cu prima alegere. Uimiți? Să încercăm să cercetam mai pe îndelete ce se întâmplă. Un concurent are acces la două strategii de joc: PĂSTREAZĂ, când decide să deschidă ușa aleasă prima dată, și SCHIMBĂ, când alege să deschidă cealaltă ușă rămasă nedeschisă. Argumentul de mai sus este echivalent cu a spune că cele două strategii au aceleași șanse de câștig. Defectul său este că nu ține cont de un lucru: în ce situații câștigă cele două strategii și cât de des apar acestea?

Pentru a nu cădea în aceeași capcană, e nevoie de o analiză mai riguroasă. Vom numerota ușile de la 1 la 3, iar pentru că la începutul jocului nu există niciun fel de informație legată de ușa unde se află mașina, putem presupune că șansele să se afle în spatele oricărei uși sunt egale, deci șansa de a nimeri ușa corectă din prima încercare este unu din trei. Mai departe, din motive de simetrie, putem presupune că prima dată ați ales ușa 1. Strategia PĂSTREAZĂ câștigă doar în cazul în care mașina este în spatele ușii 1, ceea ce se întâmplă cu șansa de unu din trei. Dacă mașina se află în spatele ușii 2, gazda va deschide ușa 3, iar strategia SCHIMBĂ va alege ușa corectă, 2. Similar, dacă mașina se află în spatele ușii 3, gazda va deschide ușa 2, iar SCHIMBĂ va alege ușa corectă, 3. În concluzie, PĂSTREAZĂ câștigă dacă și numai dacă ați ales ușa cu mașina din prima, iar SCHIMBĂ câștigă dacă și numai dacă nu ați ales-o. Cum a doua situație apare de două ori mai des decat prima, SCHIMBĂ are șanse duble de câștig față de PĂSTREAZĂ.

Tot nu sunteți convinși? Să ne imaginam aceeași situație cu 100 de uși. Alegeți o ușă la întâmplare, iar apoi gazda (care cunoaște poziția mașinii) deschide 98 dintre cele 99 de uși rămase. În care idee aveți mai multă încredere în acest moment: să păstrați prima ușă aleasă, sau să o schimbați cu cealăltă rămasă închisă? Mai pare la fel de probabil ca mașina să fie în spatele primei uși alese?

 

Probabilitate, experiment și informație

Totuși, ce este o probabilitate? În Théorie analytique des probabilités, un text clasic al teoriei probabilităților, Pierre-Simon Laplace definește probabilitatea unui eveniment ca numărul cazurilor favorabile acestui eveniment raportat la numărul tuturor cazurilor posibile, când toate aceste cazuri posibile apar la fel de des. Astfel, probabilitatea unui eveniment este un număr cuprins între 0 (când evenimentul este imposibil) și 1 (când evenimentul este sigur). Această definiție este bazată pe conceptul conjectural de șanse egale ale tuturor rezultatelor posibile și stă la baza interpretării clasice a teoriei probabilităților, care pare cea mai apropiată de intuiția umană.

De exemplu, dacă dăm cu banul și sperăm să cadă stema, avem un caz favorabil din două posibile, deci probabilitatea de câștig este ½. Din aceeași perspectivă, dacă dăm cu un zar care nu este măsluit, probabilitatea să dăm 1 este ⅙, iar dacă dăm cu două zaruri, șansa de a da o dublă este 6/36 =⅙.

Problema cu perspectiva clasică stă tocmai în ipoteza pe care se bazează. De unde știm că toate cazurile posibile au aceleași șanse? Mai mult, definiția care presupune șanse egale nu este oare circulară? Astfel, se poate ca analiza problemei cu ușile, făcută dintr-o perspectivă clasică, să nu satisfacă pe toată lumea. Dar acesta nu este singurul punct de vedere.

Empiricii s-ar putea mulțumi cu interpretarea din punct de vedere al frecvenței a probabilității, care consideră probabilitatea unui eveniment ca limita frecvenței sale relative în urma efectuării unui număr mare de experimente. Mai exact, această definiție se bazează pe conceptul empiric de experiment în urma căruia determinăm cât de des apare evenimentul dorit raportat la numărul total de evenimente, atunci când repetăm experimentul de un număr mare de ori.

În cazul monedei de mai sus, privit prin această nouă perspectivă, probabilitatea de a obține stema este tot  ½, dar nu pentru că cele două posibilități au șanse egale de apariție, ci deoarece în urma experimentelor repetate s-a demonstrat că frecvența empirică converge la limita de ½ când numărul experimentelor tinde la infinit. Similar se calculează și experimentele cu un zar sau două.

Dar ce se întâmplă cu problema inițială, din acest punct de vedere? Experimente repetate au arătat că, într-adevăr, strategia SCHIMBĂ află poziția mașinii în medie de două ori mai des decât strategia PĂSTREAZĂ. Puteți să verificați aceasta, implementând problema în orice limbaj de programare dorit. Dacă nu aveți încredere în generatoarele de numere (pseudo)aleatorii, puteți verifica problema cu 3 pahare opace și o monedă, în 2 oameni, jucând și încercând ambele strategii de un număr mare de ori.

Repetând experimentul cu 2 jucători și schimbând rolurile, vă puteți da seama de un alt aspect al problemei: informația celor doi este asimetrică. Mai mult, informația participantului la emisiune crește după acțiunea gazdei. Privind din acest punct de vedere, pare verosimil ca a doua alegere, mai informată, să aducă șanse mai mari de câștig.

Pentru a continua, este nevoie de o schimbare de perspectivă. Până acum ne-am ocupat cu problema deducerii efectelor unor cauze cunoscute. De exemplu, luând în considerare ce știm despre monede, ce este probabil să observăm când dăm cu banul de un număr mare de ori? Dar acest mod de a gândi poate fi inversat. Câteodată observăm apariția unui eveniment și dorim să privim înapoi, să vedem ce l-a putut produce. În mod normal, există mai multe cauze posibile ale unui eveniment și dorim să formulăm un raționament despre care dintre ipoteze pare mai probabilă. Aceasta este cunoscută sub numele de problema probabilității inverse și a fost analizată de matematicianul britanic Thomas Bayes. Discuția sa asupra problemei apare în eseul publicat postum An Essay Towards Solving a Problem in the Doctrine of Chances.

Descoperim astfel o nouă interpretare, bazată pe un concept epistemic, care poartă numele de interpretare bayesiană subiectivă. În cadrul ei, probabilitatea unui eveniment măsoară gradul de credință al unui individ în a îi evalua certitudinea.

Aşadar, probabilitatea unei monede de a cădea stema este tot ½, deoarece nu avem niciun fel de informație care ar prefera o față celeilalte, dar această probabilitate nu mai descrie moneda, ci credința subiectivă a individului. La fel, șansa de ⅙ de a da 1 cu un zar, sau o dublă cu două zaruri, reprezintă o credință individuală, la fel cum cotele de pariuri sportive reprezintă credințe referitoare la evoluția unor sportivi.

Dar convingerile evoluează în funcție de apariția a noi dovezi. Mai exact, dacă vrem să evaluăm evoluția credinței în posibilitatea unui eveniment A, în funcție de o nouă dovadă dată de un eveniment B, avem nevoie de o probabilitate dată de o credință anterioară în A și trebuie să calculăm cât de puternic corelate sunt A și B (care este probabilitatea ca B să apară în funcție de A). Mai exact, dacă la început credința în A este mică, B trebuie să fie o dovadă considerabilă pentru ca să schimbe în mod semnificativ probabilitatea lui A (afirmaţiile extraordinare necesită dovezi extraordinare). Mai mult, trebuie să verificăm cât de probabil este ca B să aibă loc, dacă A a avut loc (probabilitatea lui B condiționată de A). Dacă aceasta este foarte mare, atunci B poate fi o bună dovadă pentru A. În schimb, trebuie să verificăm și care este probabilitatea lui B în general, necondiționată de A. Dacă aceasta este foarte mare, atunci faptul ca B a avut loc poate să nu fie datorită lui A, iar relevanța lui B ca dovadă scade.

Privit astfel, dacă ați ales ușa 1 iar gazda a deschis ușa 2 există două posibilități. Dacă mașina se află în spatele ușii 1, atunci ușile 2 și 3 nu ascund nimic, deci șansa ca gazda să deschidă ușa 2 este ½. Dacă mașina se află în spatele ușii 3, atunci doar ușile 1 și 2 nu ascund nimic, deci șansa ca gazda să deschidă ușa 2 este 1. În concluzie, e de două ori mai probabil ca gazda să deschidă ușa 2 atunci când mașina se află în spatele ușii 3 decât atunci când se află în spatele ușii 1 și atunci e de două ori mai probabil ca ușa 3 să ascundă mașina.

Pe scurt și mai formal, dacă notăm cu P(A) probabilitatea inițială a lui A, cu P(A|B) probabilitatea lui A dacă a avut loc B și P(B|A) probabilitatea lui B dacă a avut loc A, formula lui Bayes ne dă:


P(A|B)=P(A) x (P(B|A)/P(B))

 

Mai mult, dacă notăm în general cu A' evenimentul "A nu a avut loc", atunci putem observa că P(A') = 1 - P(A). În plus, P(B) se poate calcula în funcție de P(A) și P(A'), astfel: dacă A a avut loc (ceea ce se întâmplă cu probabilitatea P(A)), atunci B are loc cu probabilitatea P(B|A), iar dacă A nu a avut loc (ceea ce se întâmplă cu probabilitatea P(A')), atunci B are loc cu probabilitatea P(B|A'). Cum cele 2 cazuri acoperă împreună toate posibilitățile, obținem legea probabilității totale: P(B) = P(B|A) x P(A) + P(B|A') x P(A').

Aplicat la problema noastră inițială, unde A reprezintă alegerea mașinii din prima, iar B deschiderea unei uși care nu ascunde nimic de către gazdă, observăm că P(A) = ⅓ si P(B|A) = P(B) = 1, deoarece gazda oricum va deschide o ușă în spatele căreia nu se află nimic. Deci P(A|B) = P(A), adică șansa ca mașina să se afle în spatele primei uși alese este tot ⅓ în urma acțiunii gazdei, nu ½. În concluzie, cum avem o singură altă opțiune, probabilitatea (în sens bayesian) ca mașina să se afle în spatele celeilate uși închise devine ⅔, deci informația primită în urma acțiunii sale poate să ne dea mai multă încredere în strategia SCHIMBĂ.

Din această perspectivă, observăm că dacă gazda nu știe unde se află mașina, dar deschide  la întâmplare o ușă care nu ascunde nimic, atunci P(B|A) = 1, in timp ce P(B|A’) = ½. Deci P(B) devine 1 x ⅓ + ½ x ⅔ = ⅔. Obținem că P(A|B) = ½, deci acțiunea gazdei schimbă probabilitatea inițială a lui A. Așadar intuiția umană, care spune că cele două strategii au aceleași șanse de câștig, se aplică doar dacă gazda nu are niciun fel de informație în plus.

 

Aspecte cognitive, cunoștinte și credințe

Interpretarea bayesiană a probabilității poate fi și obiectivă, atunci când probabilitatea unui eveniment măsoară plauzibilitatea sa, care poate fi derivată obiectiv de toată lumea care posedă aceeași informație, într-un mod justificat de cerințele raționalității și consistenței. Privită astfel, logica propozițională aristoteliană clasică, cu propoziții care sunt adevărate sau false (cunoștințe), devine extinsă de teoria probabilității, unde valoarea de adevăr a unei propoziții poate varia (credință) între 0 (complet fals) și 1 (complet adevărat).

Această perspectivă, ce susține îmbogățirea raționamentului deductiv prin extinderea sa către raționamentul plauzibil, a fost sustinută de-a lungul secolului XX de renumiți matematicieni, economiști și filosofi, ca de exemplu: John Maynard Keynes, în A Treatise on Probability, puternic sprijinit de către Bertrand Russell, Rudolf Carnap în Logical Foundations of Probability, Edwin Thompson Jaynes în Probability Theory: The Logic of Science (din nefericire neterminată) și în jurul începutului secolului XXI de către David Mumford.

Indiferent de orientarea sa, subiectivă sau obiectivă, interpretarea bayesiană a probabilității se folosește cu succes în știință și în știința medico-legală în evaluarea și reformularea continuă a unei ipoteze confruntată cu noi dovezi. Mai mult, rezultatele obținute în teoria inteligenței artificiale, în special în domeniul învățării și al modelării cunoștințelor, pare să susțină rolul ei natural în cadrul cogniției umane.

Și atunci, revenind la problema inițială, de ce pare contrar intuiției ca una dintre cele două strategii să aibă de două ori mai multe șanse de câștig decât cealaltă? O ipoteză ar putea lua în considerare argumentele lui Daniel Kahneman din Thinking, Fast and Slow, în care argumentează că sunt două modele diferite prin care creierul uman formează gânduri: sistemul 1, subconștient, este rapid, automatic, frecvent, emoțional și stereotipic,iar sistemul 2,conștient, este încet, greu, rar, logic și calculat. O mare parte a timpului o petrecem ancorați în sistemul 1, iar pentru a angrena sistemul 2 este nevoie de efort mental. Dacă suntem întrebați cât este 2+2, răspunsul vine instant, dat de sistemul 1. Dacă suntem întrebați cât este 19 ori 92, răspunsul nu mai vine la fel repede, și trebuie să angrenăm sistemul 2 în mod conștient.

Sistemul 1 nu este neapărat irațional, iar sistemul 2 nu ia întotdeauna cele mai bune decizii, dar fiecare are domeniul lui specific de aplicare. Din păcate, când folosim unul dintre sisteme în domeniul nepotrivit, pot apărea confuzii și erori sistematice de raționament (bias-uri).

Pornind de la această ipoteză, revenind la problema inițială, după ce gazda concursului deschide o ușă, sistemul 1 vede două uși deschise și răspunde instant că probabilitățile sunt egale. În acest caz, costul vitezei este o greșeală de raționament, și în general este nevoie să facem un pas înapoi pentru a analiza problema și a ajunge la concluzia corectă.

În mod curios, în urma experimentelor realizate de Walter T. Herbranson și Julia Schroeder (Are Birds Smarter Than Mathematicians?), majoritatea porumbeilor expuși la o variantă a problemei au învățat strategia optimă într-o zi, spre deosebire de grupul de studenți expuși la aceeași variantă, care au continuat să folosească strategia greșită un timp mai îndelungat. Concluzia lor tinde să susțină ipoteza conform căreia porumbeii analizează probabilitățile în mod empiric, privind lumea printr-o perspectivă a frecvenței, în timp ce oamenii recurg în general la intuiție, privind lumea printr-o perspectivă clasică.

Un alt fenomen irațional, surprins de Amos Tversky și Daniel Kahneman, este aversiunea față de pierdere (loss aversion), care reprezintă tendința generală a oamenilor de a reacționa mai puternic față de pierderi decât față de câștiguri. Kahneman atribuie acest fenomen sistemului 1 și majoritatea studiilor sugerează că o pierdere este în general percepută de aproximativ două ori mai puternic decât un câștig de aceeași valoare. Acest comportament se observă la o mare parte a oamenilor confruntați cu problema ușilor. Astfel, ei consideră că ar regreta mai mult dacă au ales mașina din prima și ar schimba ușa decât dacă nu au ghicit opțiunea corectă, dar nici nu au schimbat, deci cel mai bine este să deschidă prima ușa aleasă.

Mai mult, mulți oameni puși în fața problemei și a faptului că primul raționament este greșit, tind să devină emotivi. Aceasta se poate datora disonanței cognitive. Confruntați cu dovezi incompatibile cu credința lor (faptul că strategiile au șanse diferite), oamenii pot răspunde întâi prin a discredita informația, apoi prin a se uni în grupuri care gândesc la fel și își sprijină în continuare ideea.

Exact acest lucru s-a întâmplat în 1990, când dilema de mai sus (cunoscută în literatura de specialitate sub numele de Problema Monty Hall) a fost discutată în numărul din septembrie al revistei Parade, în rubrica Ask Marilyn a lui Marilyn vos Savant (deținătoare a recordului Guinness pentru cel mai mare IQ din 1986 până 1989). Deși rezolvarea dată de ea a fost corectă, revista a primit peste 10 000 de scrisori (dintre care 1000 semnate de deținători de doctorat în știință) care susțineau că a greșit, și nu există nicio diferență între strategii. Multe dintre scrisori recurgeau la stereotipuri și argumente de natură personală, unele dintre acestea susținând că raționamentul ei este greșit pentru că este femeie(!). Ca răspuns la aceste scrisori, Marilyn vos Savant a mai publicat un articol cu o analiză mult mai amănunțită, însoțită de sugestia adresată scepticilor de a realiza experimentul și de a concluziona singuri. Majoritatea au fost convinși de schimbarea de la perspectiva clasică la cea a frecvenței, probabil prin decuplarea sistemului 1. Însă noile argumente nu au convins pe toată lumea. Una dintre noile scrisori primite o anunța simplu: „I still think you’re wrong. There is such a thing as female logic.” („Consider că încă greșiți. Există un asemenea lucru numit logică feminină”).

În concluzie, dovezile tind să susțină ipoteza că probabilitățile ni se par grele și ne pot ridica probleme, pentru că, în lipsa antrenamentului, le abordăm cu sistemul mental 1 care nu este pregătit pentru o analiză minuțioasă. Ca o scurtă anecdotă, se pare că nici vestitul matematician Paul Erdős nu a fost convins că intuiția sa este greșită și că una dintre cele două strategii are șanse de câștig mai mare decât cealaltă, până când nu a analizat rezultatele a sute de simulări, în urma cărora a fost convins de perspectiva frecvenței, asemenea unui porumbel.