Teorema Minimax

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Teorema minimax se datorează lui von Neumann [1] [2] . Teorema minimax oferă condiții suficiente pentru ca inegalitatea max-min să fie o egalitate. Teorema constituie nu numai punctul de plecare al teoriei jocurilor , ci și o teoremă a dualității pentru problemele de programare liniară în care regiunea fezabilă este convexă și compactă (închisă și mărginită).

Este o funcție continuă unde Și sunt seturi convexe compacte . De sine este o funcție convex-concavă, adică astfel încât

este convex pentru fix și
este concav pentru fix,

asa de

Exemple

  • În teoria jocurilor pentru un joc finit cu două sume zero cu un număr finit de strategii (așa-numitele jocuri simetrice ), este ușor să ne gândim la funcția de plată ca la o formă biliniară alternativă a cărei proprietate de alternanță matematicizează opoziția totală a celor doi jucători, adică faptul că suma plăților este zero. Indicat cu Și setul de strategii pure ale celor doi jucători și plasarea
se obține definiția jocului cu sumă zero:
pentru fiecare și pentru fiecare
În jocurile finite este imediat să vedem că cele două seturi Și se dovedesc a fi compacte, deoarece sunt finite și, prin urmare, nu au puncte de acumulare. Funcțiile plăților sunt definite pe seturi fără puncte de acumulare, deci seturi constând doar din puncte izolate, adică puncte în care cele două funcții se dovedesc a fi continuu (mai uniform continuu ). În ceea ce privește cererea ca cele două seturi Și sunt convexe, este suficient să se ia în considerare politopul lor ( anvelopă convexă ) odată ce conceptul de strategie mixtă a fost introdus ca un tuplu de numere non-negativ astfel încât . Domeniul variației strategiilor mixte este mai extins decât cel al strategiilor pure: pentru acestea din urmă, de fapt, domeniul este un set finit simplu de tupluri ordonate, în timp ce strategiile mixte sunt definite pe un subset al spațiului vectorial dimensional constând din toate combinațiile liniare convexe de strategii pure și ca atare este convexă și având o dimensiune finită egală cu . Plicul convex este compact deoarece este construit pe setul compact de strategii pure. De sine se dovedește a fi convex în ceea ce privește pentru fix și de atunci , asa de se dovedește a fi concav în ceea ce privește pentru fix, astfel încât să fie îndeplinite condițiile teoremei minimax.
  • Valoarea unui joc simetric cu suma zero pentru doi jucători extins la strategii mixte are o valoare zero [3] . Valoarea unui joc prin definiție este
Luați în considerare mai întâi partea stângă a celor doi egali tocmai scrise , prin ipoteză este asa de
.
Deoarece setul de strategii pentru cei doi jucători este identic , schimbând cu primesti
.
Pentru comparație, se dovedește și, prin urmare, în mod necesar, valoarea jocului este .
  • Matricea asociată cu funcția de plăți este o matrice antisimetrică și are doar zerouri ca elemente ale diagonalei principale, deoarece dă pentru fiecare , rezultă imediat că este pentru fiecare odată ales .

Teorema min-max și programarea convexă

Teorema care stă la baza jocurilor antagonice poate fi luată ca un punct de uniune între teoria dualității și problemele programării convexe, în special cele ale programării liniare . Perechile de probleme constituite de problema primară și de problema sa duală sunt de fapt strâns legate de problema determinării punctelor de șa a funcției Lagrangiene . De sine este soluția problemei primare de maximizare și dacă este soluția problemei de minimizare duală, atunci valoarea optimă a funcției lagrangiene a problemei primare, , coincide cu valoarea optimă a funcției lagrangiene a problemei duale, . Cu alte cuvinte, relația de dualitate este adevărată:

În general, cel puțin unul dintre cele două seturi sau este un set nelimitat, prin urmare nu este compact: acesta este motivul pentru care teorema lui von Neumann nu este aplicată pe scară largă în programarea convexă [4] .

Exemplu

Într-un joc generic cu două persoane pentru suma maximă a jucătorului, avem următoarea problemă principală:

sub rezerva constrângerilor:

Funcția Lagrangiană asociată cu această problemă este:

unde este , in timp ce ele reprezintă multiplicatorii lagrange și constituie strategiile mixte ale jucătorului advers.

Am observat că funcția Lagrangiană se dovedește a fi o funcție convexă în variabilă pe ansamblu , că Lagrangianul este în mod clar o funcție liniară în , prin urmare se dovedește a fi banal concav în interior deoarece fiecare funcție liniară este atât concavă, cât și convexă și că cele două seturi Și sunt compacte, se deduce că relația dualității

este o consecință directă a teoremei minimax.

Formularea explicită a dublei probleme se obține luând în considerare

Mai întâi maximizăm Lagrangianul pentru fix și variabilă în

Fiind poti sa scrii unde este . Mi-am amintit asta primesti

.

Atâta timp cât pentru tot ij din la , vei avea de sine sau de sine .

Deci avem:

pentru

iar problema duală are următoarea formulare:

sub rezerva constrângerilor:

Loc da ai

Notă

  1. ^ J. von Neumann, Zur Theorie der Gesselschaftsspiele , Math. Ann. 100, 1928, p. 295-320.
  2. ^ J. von Neumann, Contribuții la teoria jocurilor. Vol. IV, Analele. of Mathematics Studies, nr.40 , Princeton Univ. Press, 1959, p. 13-42.
  3. ^ E. Burger, Introducere în teoria jocurilor , Prentice-Hall, Inc., 1959, p. 74.
  4. ^ EG Goldstein, Theory of Convex Progrmamming , Providence, SUA, American Mathematical Society, 1972, p. 7.