Dilema prizonierului

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Vor coopera cei doi prizonieri pentru a-și minimiza pedepsele sau unul dintre ei îl va trăda pe celălalt pentru a-și minimiza pedepsele?

Dilema prizonierului este un joc complet al informațiilor propuse în anii cincizeci ai secolului al XX-lea de Albert Tucker ca o problemă a teoriei jocurilor . Pe lângă faptul că a fost studiată pe larg în acest context, „dilema” este, de asemenea, destul de bine cunoscută publicului non-tehnic ca exemplu de paradox . John Von Neumann , creatorul teoriei jocurilor, a devenit și el interesat de această dilemă, prezentată de cei doi creatori în timp ce lucra la RAND în 1948.

Dilema în sine, chiar dacă folosește exemplul celor doi prizonieri pentru a explica fenomenul, poate descrie la fel de bine cursa înarmărilor din anii 1950 de către SUA și URSS (cei doi prizonieri) în timpul Războiului Rece . [1]

Corolarul acestei dileme, numit Aie's (din numele celor 3 profesori universitari care au teorizat-o în 1988, Astegy, Inglot și Elghi) prevede întotdeauna că unul dintre cei doi îl trădează pe celălalt.

Dilema

Dilema poate fi descrisă după cum urmează. Doi infractori sunt acuzați de săvârșirea unei infracțiuni. Anchetatorii îi arestează pe amândoi și îi încuie în două celule diferite, împiedicându-i să comunice. Fiecăruia dintre ei li se oferă două opțiuni: să colaboreze sau să nu colaboreze. De asemenea, li se explică că:

  1. dacă doar unul dintre cei doi colaborează acuzându-l pe celălalt, cel care a colaborat evită pedeapsa; cealaltă, însă, a fost condamnată la 7 ani de închisoare.
  2. dacă ambii îl acuză pe celălalt, ambii sunt condamnați la 6 ani.
  3. dacă niciunul dintre ei nu colaborează, ambii sunt condamnați la 1 an, deoarece în orice caz sunt deja vinovați de transport ilegal de arme.

Acest joc poate fi descris cu următoarea bimatrix :

colaborează nu cooperează
colaborează (6,6) (0,7)
nu cooperează (7,0) (1.1)

Cea mai bună strategie în acest joc necooperant este ( colaborează, colaborează ) pentru că nu știm ce va alege celălalt să facă. Pentru fiecare dintre cele două, scopul este de fapt să-și reducă propria propoziție; și fiecare prizonier:

colaborând: riscă 0 sau 6 ani
nu cooperează: riscă 1 sau 7 ani

Strategia nu cooperează este strict dominată de strategia cooperează . Eliminarea strategiilor strict dominate duce la echilibrul Nash , unde cei doi prizonieri colaborează și au 6 ani de închisoare. Cel mai bun rezultat pentru cei doi („ excelentul Pareto ”) este, desigur, să nu coopereze (1 an de închisoare în loc de 6), dar acesta nu este un echilibru.

Să presupunem că cei doi au promis că nu vor coopera în caz de arestare. Acum sunt închiși în două celule diferite și se întreabă dacă promisiunea va fi respectată de cealaltă; dacă un deținut nu își ține promisiunea și celălalt o face, atunci primul este eliberat. Prin urmare, există o dilemă: a colabora sau a nu colabora. Teoria jocurilor ne spune că există un singur echilibru ( colaborează , colaborează ).

Dacă ne gândim la Statele Unite și URSS ca la cei doi prizonieri și la mărturisire ca armă atomică (pe de altă parte, negarea ar însemna dezarmare unilaterală), dilema descrie modul în care era inevitabil pentru cele două națiuni în momentul războiul. rece cursa înarmărilor, deși acest rezultat final nu a fost optim pentru nici una dintre cele două superputeri (și pentru întreaga lume). [2]

Paradoxul

Dilema prizonierului a cauzat interesul ca exemplu al unui joc în care axioma raționalității aparent eșuează, prescriind o acțiune care dăunează mai mult ambelor părți ale alegerii alternative ( nu cooperează , nu cooperează ). Teoreticienii jocurilor subliniază că cei care gândesc astfel imaginează probabil un joc diferit, în care victoria este apreciată pe suma de ani de închisoare.

Acesta este jocul:

colaborează nu cooperează
colaborează (12) (7)
nu cooperează (7) (2)

Este ușor de văzut că acest nou joc, simplificând strategiile dominante , are ca echilibru ( nu cooperează , nu cooperează ), aceasta este alegerea care duce la cel mai bun rezultat posibil pentru ambele.

Această a doua formulare (adăugarea anilor de închisoare) prevede că prizonierul ar trebui să prefere cel mai mic rău cuplului, dar acesta nu este scopul său în formularea inițială. În acest sens, el ar trebui să fie interesat doar de riscurile pe care și le asumă personal.

Solutii posibile

În acest moment s-ar putea întreba:

  • "Este posibil să nu existe o concluzie logică care să permită prizonierului să spere să rămână în închisoare doar un an sau chiar nici una?"
  • "Este posibil ca logica să nu vină cu altă soluție decât să accepte să fie condamnat la șase ani fără nicio speranță?"

O posibilă soluție este următoarea, dar necesită două clarificări și nu este acceptată universal:

a) trebuie presupus că toate personajele au o abilitate logică aproape perfectă. Acest lucru nu înseamnă că trebuie să fie buni, altruisti sau orice altceva, ci doar că toată lumea înțelege jocul în același mod și nu face nicio greșeală;
b) punctul dat a) este ușor de înțeles că toată lumea va lua aceeași decizie . Nu poate exista nimeni care să fie inteligent în detrimentul celorlalți, deoarece acest lucru ar însemna automat că și alții vor face ca el. Numai cititorul „neatent” se poate gândi să facă inteligent un personaj.

În acest moment devine clar că, dacă unul dintre prizonieri înțelege că concluziile la care ajunge sunt aceleași cu cele la care a ajuns celălalt, alegerea nu cooperează este singura acțiune posibilă.

De fapt, dacă suntem convinși că le este imposibil să dea răspunsuri diferite (vezi punctul b), atunci discursul egoist cade. Rămânând doar posibilitățile ( colaborează , colaborează ) și ( nu colaborează , nu colaborează ) alegerea este dovada îndoielii.

O altă soluție este cea propusă de teoria jocurilor informaționale incomplete .

Dilema prizonierului și dimensiunea timpului

Putem observa două soluții diferite la situații de tipul „dilemei prizonierului” dacă actorii modelului trebuie să ia aceeași decizie mereu.

Construim o matrice ordinală de plată , unde a> b> c> d. Să luăm în considerare un joc de tip dilemă al prizonierului cu N jucători (plasând în matricea noastră alegerea unui jucător pe verticală și alegerea tuturor celorlalți pe orizontală).

poluează nu poluează
poluează (c, c ) (a, d )
nu poluează (d, a ) (b, b )

Pentru jucători, cea mai bună dintre toate lumile posibile este să trăiești într-o lume curată (să ne imaginăm că joci un număr de N de jucători suficient de mare încât comportamentul individului să aibă o influență foarte mică asupra rezultatului final, dar are un efect direct asupra plății lor off. ), dar fără a face față costurilor pentru a-l menține curat (situația clasică „free rider”).

Să presupunem că:

  • toți agenții sunt determinați să decidă ce să facă din nou și din nou.
  • Agenții au încheiat un acord care i-ar obliga să aibă o atitudine de cooperare (așa cum am văzut, o soluție de cooperare ar garanta un rezultat mai bun).
  • De fiecare dată, fiecare dintre ei, putând observa comportamentul celorlalți jucători, poate decide dacă ceilalți sunt de încredere.
  • Un jucător care trădează acordurile este considerat a nu fi în mod constant credibil, prin urmare, posibilitatea unui acord nu mai este valabilă.

Considerăm r ca o rată de reducere care se aplică plăților pentru reducerea valorii plăților viitoare (pe scurt, o rată care exprimă preferințele intertemporale ale jucătorilor individuali).

Echilibru cooperativ

Echilibru necooperant

după cum puteți vedea, jucătorul câștigă mult în prima perioadă, ajungând la o payoff o, dar în următoarele perioade el intră într - un echilibru necooperant.

alegerea jucătorilor va fi cooperantă dacă:

și în special presupunând că r este egal pentru ambii jucători (adică preferințele intertemporale sunt egale între cei doi) dacă:

Fals paradox al probabilității versus logică

Este ușor de văzut că, dacă amândoi aruncau o monedă, ar avea mai multe șanse de a face puțină închisoare decât de a folosi strategia inteligentă ; intr-adevar:

Alegere inteligentă : 100% să dureze 6 ani
Alegere cu moneda: 25% să dureze 7 ani
25% să dureze 6 ani
25% pentru a lua 1 an
25% să dureze 0 ani

În alegerea cu moneda este clar că situația este mai bună pentru ambii (0,25 * 7 + 0,25 * 6 + 0,25 * 1 + 0,25 * 0 = 3,5 ani de medie pe care ar lua-o). Suntem în favoarea unui bun 75% din cazuri: în 50% din cazuri pedeapsa va fi redusă semnificativ cu 5 sau 6 ani (în ultimul caz va fi chiar redusă la zero), iar în 25% din cazuri vom risca să primim aceeași propoziție pe care am fi jucat- o inteligent . Prin urmare, ar părea un paradox, fiind o alegere mai bună pentru a răsturna o monedă mai degrabă decât pentru a aplica logica.

Pe de altă parte, aruncarea unei monede nu este o alegere convenabilă pentru un jucător rațional, cu excepția cazului în care un acord obligatoriu îi obligă pe amândoi să arunce moneda; în acel moment, totuși, ar fi și mai bine un acord obligatoriu care să-i oblige pe amândoi să rămână în tăcere.

În cazul în care unul dintre cei doi arunca moneda și celălalt ar fi făcut o alegere „inteligentă”, de fapt, știind că celălalt a aruncat moneda, dar fără să știe rezultatul aruncării, situația îl va împinge pe al doilea să colaboreze: de fapt, în 50% din cazuri ar dura 0 ani față de 1 (dacă celălalt nu colaborează) și în 50% din cazuri 6 ani față de 7 (dacă celălalt colaborează).

Prin urmare, aparentul paradox nu există și un jucător rațional, în absența unor acorduri obligatorii, va alege întotdeauna să colaboreze.

Notă

  1. ^ Matematică pentru strategii și echilibre - Linx Magazine - Revista științifică pentru clasa Arhivat 8 mai 2014 la Internet Archive ..
  2. ^ Această situație de echilibru răspunde la „ echilibrul Nash ”, una dintre cele mai importante teoreme ale teoriei jocurilor , enunțată de matematicianul american John Forbes Nash .

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tesauro BNCF 58798 · LCCN (EN) sh85106969 · GND (DE) 4139587-6 · BNF (FR) cb12526229f (dată) · BNE (ES) XX550497 (dată)
Matematica Portalul de matematică : accesați intrările Wikipedia care se ocupă de matematică