Paradoxul celor două plicuri

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Paradoxul celor două plicuri derivă dintr-un raționament logic - matematic , aparent impecabil, care demonstrează că, între două plicuri de valoare diferită, dar declarate extern de nedistinguibil, odată ce unul dintre cele două a fost ales, încă merită să-l schimbi.

În realitate, așa cum este intuitiv, câștigul așteptat dintr-un schimb de plicuri în ultimul moment ar trebui să fie zero în medie, dar, în situația preconizată, este destul de subtil să identificăm dacă afirmația , raționamentul logic sau intuiția sunt eronate. .

Analiza acestui paradox atrage atenția asupra evaluării nu întotdeauna banale a probabilității condiționate și asupra limitelor ipotezei echiprobabilității pentru evenimente cu cauze necunoscute.

Situatie

Într-un joc cu premii ipotetice, concurentului i se prezintă două plicuri sigilate, fiecare conținând o indicație a unui premiu în bani, pe care concurentul îl va primi dacă alege. Se știe că valoarea indicată într-un plic este exact dublă față de cealaltă, dar nu se știe care dintre cele două conține premiul cel mai mare.

Concurentul poate obține premiul unui singur plic, dar i se oferă posibilitatea de a face alegerea finală chiar și după ce a deschis un plic așa cum îi place și după ce a văzut valoarea acestuia.

Paradox

  • Pare evident că:
    1. nu există nicio diferență în alegerea unuia sau a celuilalt plic, înainte de deschidere.
    2. cunoașterea valorii unui plic nu adaugă informații la întrebarea dacă acesta este mai mare sau mai mic decât celălalt.
Deci, nu există niciun motiv pentru a prefera unul sau altul plic, înainte de a fi deschis unul sau altul.
  • Cu toate acestea, aplicând teoria deciziei , se ajunge la concluzia paradoxală că este întotdeauna convenabil să alegeți celălalt plic.
    De fapt, dacă plicul pe care alegeți să îl deschideți mai întâi conține, să zicem, un premiu de valoarea A, celălalt plic va conține un premiu de valoarea A / 2 sau un premiu de valoarea 2A.
    În cazul schimbului: dacă ar merge prost, prima s-ar reduce la jumătate (pierdere = A / 2), dar, dacă ar merge bine, s-ar dubla (câștig = A).
    Pe baza informațiilor disponibile, niciuna dintre cele două situații - că A / 2 se pierde sau A este câștigat - pare să fie favorizată față de cealaltă, prin urmare cea mai rezonabilă strategie pare să ia în considerare ambele opțiuni la fel de probabile, cu probabilitatea 1 / 2 și 1/2.
    Așadar, merită cu siguranță să-ți încerci norocul și să alegi să schimbi plicul, având în vedere diferența clară între posibilul câștig și posibila pierdere.
În termeni matematici, dacă calculăm câștigul așteptat din schimbarea anvelopei (probabilitatea de a câștiga înmulțită cu valoarea câștigului, probabilitatea mai mică de a pierde înmulțită cu valoarea pierderii), obținem:
o cantitate care este pozitivă pentru orice valoare a lui A.

Concluzionăm că este întotdeauna recomandabil să schimbați plicul, indiferent de valoarea pe care o găsim în acea primă alegere (și, prin urmare, chiar fără să ne uităm înăuntru!). Acest lucru pare evident absurd.

Dacă afirmația potrivit căreia este întotdeauna convenabil să se schimbe este cu adevărat absurdă, rămâne problema identificării erorilor argumentului tocmai prezentat.

Soluţie

Raționamentul se bazează pe două condiții:

  1. probabilitate de 50% pentru cazul favorabil și aceeași pentru cel opus;
  2. cunoașterea valorii premiului conținut într-un plic.

Aceste presupuneri ar fi ambele corecte în sine, dar nu sunt în același timp.
De fapt, ele se referă la două cazuri distincte:

Cazul 1 - plicuri închise, fără paradox

  • Numim X cel mai mic premiu și Y cel mai mare premiu. Valorile nu sunt cunoscute, dar știm că Y este de două ori mai bun decât X (Y = 2X) și că sunt distribuite în mod egal între cele două plicuri.

Dacă deschideți plicul mai întâi cu X, schimbându-l, veți găsi Y (= 2X), cu un câștig egal cu YX = X.

Dacă deschideți plicul mai întâi cu Y, schimbarea ar avea ca rezultat X, de data aceasta cu o pierdere netă egală cu YX = X.

Prin urmare, vedem că câștigul și pierderea sunt egale și echipabile, așa cum ar fi trebuit să fie intuitiv.

Revenind la raționamentul inițial al paradoxului, trebuie avut în vedere faptul că valoarea A, găsită la deschiderea primului plic, este valabilă o dată X și o dată Y, în funcție de care plic este ales primul.
Prin urmare, este greșit să spunem că o pierdere egală cu A / 2 (la schimbarea după prima deschidere a plicului cu cea mai mare valoare și A = Y = 2X ) este diferită de un câștig egal cu A (la schimbarea după prima deschidere a plicului cu cea mai mică valoare și A = X ). În realitate, pierderea într-un caz este egală cu câștigul în cazul opus.

Cazul 2 - un plic deschis

  • numim A valoarea găsită în plicul deschis. De această dată, victoria poate fi doar A și pierderea doar A / 2. Dar nu mai putem spune cu certitudine că probabilitatea dintre cele două cazuri este aceeași.

Depinde puternic de valoarea lui A, în raport cu distribuția probabilității premiilor posibile. Intuitiv am putea spune că, dacă am găsit un premiu mare, ar trebui să fim mulțumiți și, dacă am găsit un premiu mic, ar trebui să încercăm celălalt plic.

Cu alte cuvinte, totul depinde de criteriul cu care au fost alese premiile care trebuie incluse în plicuri și de care este premiul maxim posibil.

Prima maximă definită

Să presupunem, de exemplu, că cel mai mare premiu din plicuri a fost ales la întâmplare (cu probabilitate egală) între zero și 2 milioane, ca valoare maximă. În consecință, prima mai mică va fi între zero și un milion, cu aceeași distribuție de probabilitate.

În aceste condiții, dacă valoarea A găsită în primul plic este mai mică de un milion, avem șanse mari să câștigăm în bursă (câștigul mediu așteptat egal cu A , cu A în medie o jumătate de milion) [1] .

Dar, desigur, am avea certitudinea unei pierderi, dacă ne-am schimba atunci când A este mai mare de un milion (câștigul mediu așteptat egal cu „minus A / 2 ”, cu A în acest caz în medie un milion și jumătate = 3 / 2 din milioane)!

Dacă am decide să ne schimbăm, în orice caz, am descoperi că, în general, valoarea așteptată a câștigului ar fi exact zero. De fapt, calculând corect valoarea pierderii pentru probabilitatea de a pierde, se găsește un rezultat egal cu valoarea câștigului pentru probabilitatea de a câștiga. (De fapt, există o probabilitate de 3/4 [2] de a găsi o valoare între zero și un milion, cu un câștig mediu de 1/4 dintr-un milion și o probabilitate de 1/4 [2] de a găsi o valoare între una milioane și două milioane, cu o pierdere medie de 3/4 dintr-un milion)

Din nou paradoxul dispare . Raționamentul inițial nu se aplică, deoarece nu ia în considerare limita maximă a premiului sau probabilitatea diferită consecventă de a fi ales primul plicul cu cel mai mare sau cel mai mic premiu.

Fără limită de premiu

Dacă nu stabilim valoarea maximă a premiului, admitem implicit că poate deveni teoretic infinit. Păstrând ipoteza că premiile au fost alese la întâmplare , cu distribuție uniformă (singura pe care o putem ipoteza în absența altor indicații), concluzia rămâne valabilă din punct de vedere matematic că este indicat să se schimbe numai dacă valoarea găsită în prima plicul este mai mic de jumătate din maxim și că altfel nu merită.

Dar de data aceasta, dacă maximul este infinit, chiar și jumătate din maxim este infinit și, din moment ce comparațiile dintre cantitățile infinite nu respectă exact regulile comparațiilor dintre mărimile finite, paradoxul rămâne și poate fi explicat pur și simplu prin amintirea că deseori infinitul se comportă într-un mod paradoxal [3] sau mai bine, într-un mod contra-intuitiv.
În acest caz, de exemplu, orice valoare (finită) am găsit la deschiderea primului plic, cu siguranță ar fi mai puțin de jumătate din maxim (infinit) și, prin urmare, am avea (întotdeauna) șanse mari de a câștiga în schimb. În practică nu ne putem imagina niciodată găsirea unui plic cu o valoare infinită în interior și nici nu ar avea sens să stabilim dacă această valoare (infinită) este mai mică sau mai mare decât jumătate din maxim (de asemenea infinit). Prin urmare, neglijăm complet să numărăm greutatea acestor eventualități teoretice și concluzionăm că este întotdeauna convenabil să ne schimbăm.

Pe de altă parte, chiar și în acest caz, cu un echilibru bine făcut, alegerea de a schimba „întotdeauna” implică un câștig zero așteptat, dacă ponderea pierderilor (sau câștigurilor) infinite este luată în considerare în mod corespunzător.

Schiță istorică

O formulare similară cu acest paradox datează cel puțin din 1953, când un matematician belgian, Maurice Kraitchik , a propus acest puzzle:

Doi oameni la fel de bogați vin să-și compare conținutul portofelelor, niciunul dintre ei nu știe exact conținutul. Au stabilit jocul în acești termeni: cine are mai puțini bani în portofel, va primi toți banii din portofelul celuilalt (nu se întâmplă nimic, dacă cele două valori sunt aceleași).

Unul dintre cele două poate argumenta după cum urmează: Să presupunem că am o cantitate A în portofel: acesta este maximul pe care l-aș putea pierde. Dacă, pe de altă parte, voi câștiga (probabilitate 0,5), în final voi avea în portofel o valoare cu siguranță mai mare de 2A. Deci jocul este favorabil pentru mine.

Celălalt poate raționa exact în același mod. De fapt, prin simetrie, jocul este egal. Unde este atunci eroarea în raționamentul fiecărui om?

Martin Gardner a popularizat puzzle-ul în cartea sa din 1982 Aha! Gotcha , din nou sub forma unui pariu pe portofel. În 1989, Barry Nalebuff a prezentat-o ​​sub forma celor două plicuri și, de atunci, aceasta a fost forma cea mai frecvent utilizată.

Perspective matematice

Cazul 1

Înainte de a deschide plicuri, este corect să oferiți unui plic 50% șanse să conțină cel mai mare (sau cel mai mic) premiu.

Cu toate acestea, riscați să faceți o greșeală dacă atribuiți o valoare X premiului și dacă vă gândiți o dată ca și cum acest X ar fi cel mai mare premiu, dar imediat după aceea, ca și cum X ar fi cel mai mic premiu.

Cu toate acestea, este posibil să se evite analiza variabilei stochastice X, prin simpla atribuire a valorilor prime egale cu X și 2X celor două plicuri. Această atribuire, valabilă indiferent de distribuția probabilității premiilor, permite definirea corectă a diferenței dintre cele două pachete.

Această diferență, în cazul unui schimb, corespunde pierderii suportate, dacă primul plic conține valoarea mai mare, dar și câștigului obținut, dacă primul plic conține valoarea mai mică.

Cazul 2

Presupunând că cunoaștem valoarea premiului conținut într-un plic și dorim să luăm în considerare modul în care aceste informații pot influența decizia de modificare, devine esențial să formulăm o ipoteză cu privire la distribuția probabilității cu care au fost alese premiile din plicuri. .

Cu un pasaj matematic se poate arăta că, în orice caz, indiferent de această distribuție, schimbarea implică un câștig zero așteptat.

Distributie uniforma

  • Știm că fiecare valoare Y , care poate fi inserată în plicul de valoare mai mare, este asociată cu o valoare X = Y / 2 care trebuie inserată în plicul de valoare mai mică.
  • Numim x cea mai mică valoare și y cea mai mare valoare conținută în perechea de plicuri în joc.

Putem presupune că y a fost ales la întâmplare dintr-o distribuție uniformă între un minim m și un maxim M.

Numim această distribuție de probabilitate p (y).

În consecință, x este ales la întâmplare într-un interval de jumătate, de la m / 2 la M / 2 , cu o distribuție uniformă a valorii duble

p (x) = 2p (y).
  • Prin urmare, valoarea A pe care o vom găsi în primul plic va avea probabilitate:
  1. p (x) (mm / 2) să aparțină clasei x, în intervalul de la m / 2 la m. - La schimb câștigi A.
  2. p (x) (M / 2-m) să aparțină clasei x, în intervalul de la m la M / 2. - La schimb câștigi A.
  3. p (y) (M / 2-m) să aparțină clasei y, în intervalul de la m la M / 2. - La schimb pierzi A / 2.
  4. p (y) (MM / 2) să aparțină clasei y, în intervalul de la M / 2 la M. - A / 2 se pierde în schimb.

Pentru a normaliza, astfel încât probabilitatea generală să fie egală cu 1, suma celor patru cazuri trebuie să fie egală cu 1:

p (x) m / 2 + p (x) (M / 2-m) + p (y) (M / 2-m) + p (y) M / 2 = 1
p (y) (m + 2 (M / 2-m) + (M / 2-m) + M / 2) = 1

Acesta este:


  • În cele patru cazuri, prin urmare, se obțin următoarele valori medii ale câștigului așteptat din schimb (valoarea medie a intervalului, înmulțită cu probabilitatea intervalului în sine):
  1. + A (medie) = 1/2 (m + m / 2), cu probabilitate p (x) m / 2, adică
  2. + A (medie) = 1/2 (M / 2 + m), cu probabilitate p (x) (M / 2-m), adică
  3. -A / 2 (medie) = -1/4 (M / 2 + m), cu probabilitate p (y) (M / 2-m), adică
  4. -A / 2 (medie) = -1/4 (M + M / 2), cu probabilitate p (y) M / 2, adică
  • Adăugând cele patru cazuri, vedem că câștigul general așteptat este exact zero. Mai detaliat, este pozitiv pentru A mai mic de m (caz 1) și pentru A între m și M / 2 (caz 2 + caz 3), dar este negativ pentru A mai mare decât M / 2 .
  • Acest rezultat poate fi extins cu ușurință la cazul în care m minim devine mic până la zero, anulând primul interval.
  • Din nou, rezultatul câștigului zero rămâne valabil chiar și în cazul în care M devine cât de mare se dorește, până la infinit.
  • În acest din urmă caz, însă, sensul intervalului 4 se pierde, de la 1/2 infinit la infinit. Dacă nu trecem mai întâi de la analiza M finit, suntem ușor conduși să neglijăm influența acestui interval și pierdem posibilitatea de a explica originea paradoxului.

O caracteristică deranjantă a distribuției uniforme este că, atunci când intervalul M devine infinit, probabilitatea oricărei valori devine evanescentă.
Din nou, când intervalul M devine infinit, recompensa medie așteptată de la deschiderea unui plic în sine devine infinită. Acesta este un alt aspect important, care explică de ce poate părea avantajos să te schimbi mereu . Oricare ar fi valoarea (finită) găsită în primul plic, aceasta va apărea întotdeauna sub media așteptată.

Alte distribuții

Pentru a depăși problemele probabilității evanescente și a premiilor infinite, au fost analizate distribuțiile de probabilitate scăzute pentru premiile mari.

Dacă distribuția probabilității p (y) scade, pe măsură ce y crește, mai repede decât 1 / y, devine posibil să se normalizeze probabilitatea generală la 1 împărțind la zero la infinit integral al lui p (y) dy, care în acest caz este nu infinit.

Cu toate acestea, prima medie așteptată va rămâne în continuare infinită, cu excepția cazului în care distribuția probabilității scade, pe măsură ce y crește, mai rapid decât .

În acest din urmă caz, comparația dintre probabilitatea ca o valoare A, găsită în primul plic, să fie jumătate din valoare, să zicem y = 2A, conținută în al doilea plic (pentru care ar fi convenabil să se schimbe) și probabilitatea opusă, care este tratată în loc de dublul unei valori, să zicem x = A / 2, conținută în al doilea plic (deci nu ar fi convenabil să se schimbe), este atât de nefavorabil încât nu este niciodată convenabil să se schimbe.

În toate cazurile, inclusiv cea a distribuției uniforme și cea a distribuțiilor medii infinite, valoarea așteptată a câștigului mediu este întotdeauna exact zero.

Pentru dovada analitică, este convenabil să începeți prin atribuirea a două simboluri diferite probabilității , că un premiu (de o valoare mai mare) între Și , și probabilitate , că un premiu (de valoare mai mică) între Și . Sunt:

Evident, când ., trebuie să fie . Acesta este:

Probabilitatea de a găsi o valoare în primul plic este dat de suma probabilității , acea să fie valoarea mai mică (și, prin urmare, z se câștigă în schimb), plus probabilitatea , acea este valoarea mai mare (și, prin urmare, z / 2 se pierde în schimb). În general, câștigul ratei de schimb preconizat este:

.

Prin urmare, vedem că câștigul este pozitiv atunci când , adică, atunci când probabilitatea a priori de a alege o anumită valoare a premiului este de peste patru ori probabilitatea ca o valoare dublă să fie aleasă.

În cazurile în care această condiție nu este îndeplinită, de exemplu, cu o funcție de tipul sau, mai clar, atunci când există o valoare maximă M a primei posibile, e este inclus între M / 2 și M, nu este convenabil să se schimbe și paradoxul nu apare.

În celelalte cazuri, ne aflăm în situația paradoxală, sau mai degrabă contraintuitivă, în care câștigul este pozitiv pentru fiecare valoare a , dar suma integrală a câștigurilor așteptate, extinsă de la zero la infinit, este zero. Intr-adevar:

Setarea w = 2z și dw = 2dz :

care este exact zero, indiferent de distribuția probabilității .

Notă

  1. ^ Referindu-ne la cazul ipotezat, probabilitatea ca valoarea generică A să fie aleasă ca primă cea mai mare este egală cu 1 din două milioane .
    În mod similar, probabilitatea ca o valoare generică A (mai mică de un milion) să aparțină clasei premium inferioare este de 1 la un milion .
    Cu alte cuvinte, o valoare A mai mică de un milion este de două ori mai probabil să fie un premiu „ minor ”, comparativ cu probabilitatea de a fi un premiu „ major ” (în mod evident, o valoare A peste un milion ar fi cu siguranță o „ mai mare ”) premiu).
    Deci, dacă A este mai mic de un milion, dacă decideți să vă schimbați, aveți 2 șanse să vă dublați (să câștigați un alt A ) și 1 șansă să vă înjumătățiți câștigurile (să pierdeți A / 2). Cu alte cuvinte, se obține „în medie” un câștig egal cu (2/3 A - 1/3 A / 2) = A / 2.
  2. ^ a b Calculul este ușor verificat concentrându-se doar pe premii cu valoare întreagă. Astfel, am avea un milion de plicuri cu cele mai mici premii (de la unu la un milion), conectate la tot atâtea plicuri cu premii duble (de la două la două milioane). Dintre aceste ultime plicuri, jumătate ar conține, evident, valori mai mici de un milion, iar jumătate ar conține valori mai mari. În total, ar exista un milion și jumătate de plicuri cu o valoare mai mică de un milion și jumătate de plicuri cu o valoare mai mare. Deci, deschizând primul pachet la întâmplare, vom avea o șansă de 3 din patru să găsim o valoare mai mică de un milion și una din patru șanse să găsim una mai mare.
  3. ^ Un exemplu simplu al comportamentului „paradoxal” al infinitului poate fi derivat din paradoxul lui Galileo . Câte numere pare sunt, comparativ cu totalul numerelor naturale?
    S-ar putea spune că sunt jumătate din total, deoarece în secvența naturală alternează cu numere impare. Dar, gândindu-ne la asta, totalitatea numerelor pare nu poate fi mai mică decât totalitatea numerelor întregi: de fapt, pentru fiecare număr întreg există dublul său, care este egal.
    Evident, regulile obișnuite nu se aplică infinitului.
    Pictogramă lupă mgx2.svg Același subiect în detaliu: Paradoxurile infinitului .

Elemente conexe