Metoda de maximă probabilitate

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Metoda de maximă probabilitate , în statistici , este o procedură matematică pentru determinarea unui estimator . Caz particular al celei mai largi clase de metode de estimare bazate pe estimatori extremi , metoda constă în maximizarea funcției de probabilitate , definită pe baza probabilității de a observa o realizare eșantion dată, condiționată de valorile asumate de parametrii statistici care sunt evaluați . Metoda a fost dezvoltată inițial de către geneticianul și statisticistul Sir Ronald Fisher , între 1912 și 1922 .

Descriere

Filozofia metodei

Având în vedere o distribuție de probabilitate , cu funcție de masă de probabilitate (sau densitate , dacă este continuă ) , caracterizat printr-un singur parametru , dat un eșantion de date observate in marime probabilitatea asociată cu datele observate poate fi calculată:

Pe de altă parte, este posibil ca este necunoscut, deși eșantionul este cunoscut a fi extras din distribuție . O idee de estimat atunci este să folosim datele disponibile pentru noi: pentru a obține informații despre .

Metoda de maximă probabilitate caută cea mai probabilă valoare a , adică cercetare, în spațiu a tuturor valorilor posibile ale , valoarea parametrului care maximizează probabilitatea de a fi obținut eșantionul dat. Din punct de vedere matematic, sau echivalent se numește funcția de probabilitate , iar estimatorul de probabilitate maximă se obține astfel:

Exemple

Pentru a ilustra metoda de maximă probabilitate, luați în considerare un eșantion a variabilelor aleatorii distribuite identic și independent, cudistribuție normală : . Funcția de probabilitate asociată este:

Maximizarea funcției de probabilitate este echivalentă cu maximizarea logaritmului său:

Parametrii Și sunt determinate prin rezolvarea problemei maxime:

Condițiile de primă ordine pentru un maxim definesc următorul sistem de ecuații în Și :

unde semnele superindice de deasupra parametrilor denotă estimatorii lor. Estimatorul de maximă probabilitate pentru medie urmează imediat din prima ecuație :

aceasta este media eșantionului . Varianța estimatorului este dat de următoarea expresie [1] :

Prin înlocuire în a doua ecuație , avem estimatorul de probabilitate maximă pentru varianță :

adică varianța eșantionului .

Exemplul este deosebit de potrivit, deoarece permite ilustrarea unor proprietăți ale estimatorilor de maximă probabilitate. Este imediat să se verifice corectitudinea (sau imparțialitatea ) :

Pe de altă parte, nu se bucură de această proprietate. Amintindu-mi că:

rezultă că:

Asa de nu este un estimator corect ; un astfel de estimator ar fi dat de statistici:

Pe de altă parte, este demn de remarcat faptul că estimatorul de maximă probabilitate este în orice caz un estimator corect asimptotic ; intr-adevar:

În special, orice estimator de maximă probabilitate este asimptotic corect și asimptoticdistribuit în mod normal .

Expresia pentru varianța estimatorului este dincolo de scopul acestui exemplu.

Este interesant de observat că estimatorii derivați în această secțiune sunt identici cu cei care pot fi obținuți, în aceleași condiții, folosind metoda momentului ; pentru evitarea îndoielii, trebuie remarcat faptul că cele două metode de cercetare a estimatorilor nu conduc neapărat la identificarea aceluiași estimatori în condiții mai generale.

Cazuri patologice

Dincolo de problemele evidențiate în exemplele de mai sus, alte dificultăți mai generale pot fi asociate cu estimatorii de maximă probabilitate.

Este posibil ca valoarea estimatorului de maximă probabilitate să nu aparțină spațiului parametrilor . Luați în considerare cazul unui eșantion de vc distribuite identic și independent, cu parametrul distribuție Poisson . Funcția de probabilitate asociată este:

Astfel, rezultă funcția log-probabilitate:

Prin urmare, estimatorul maxim al probabilității ar fi . Cu toate acestea, presupuneți că ; atâta timp cât , estimarea obținută cu metoda probabilității maxime nu este admisibilă.

La prima vedere, problema poate părea a fi un detaliu matematic de mică relevanță în practică; cu toate acestea, domeniul său de aplicare în aplicații este mai relevant decât pare. Rămânând în contextul exemplului prezentat mai sus, rețineți că variabila aleatorie Poissoniană este adesea utilizată ca model pentru numărul de sosiri la ghișeu, birou, stație de autobuz etc. (aceasta este o aplicație a teoriei de așteptare , care se referă la procesul Poisson mai precis); în acest context, reprezintă rata așteptată a sosirilor pe unitate de timp. Este clar că să speculezi într-o oarecare măsură distorsionează procesul examinat: se poate întâmpla că, în intervalul de timp corespunzător eșantionului utilizat pentru estimare, niciun client să nu fi ajuns la ghișeu (niciun pasager la stația de autobuz etc.); acest lucru nu înseamnă că niciun client (sau pasager etc.) nu ar trebui să sosească vreodată!

În plus, estimatorul de maximă probabilitate nu este neapărat unic . Luați în considerare, de exemplu, cazul unui eșantion a variabilelor aleatorii distribuite identic și independent, având distribuție uniformă pe interval , cu . Funcția de probabilitate asociată este:

unde este denotă funcția indicator . Să presupunem că eșantionul este sortat în așa fel încât:

(această ipoteză este legitimă ca sunt distribuite independent). Este ușor să arăți că:

Rezultă că estimatorul de maximă probabilitate pentru este unic dacă și numai dacă ; în caz contrar, un număr infinit de valori ale estimatorului maximizează funcția de probabilitate.

Proprietățile estimatorilor de maximă probabilitate

Invarianța funcțională

De sine este estimatorul de maximă probabilitate pentru parametru , apoi estimatorul de maximă probabilitate pentru Și , acest lucru se aplică tuturor , indiferent dacă este o funcție bijectivă .

Deformare

Estimatorii probabilității maxime, așa cum se ilustrează în exemple, pot fi distorsionați (adică incorecți sau părtinitori față de limba engleză), de asemenea într-un mod consecvent. Pe de altă parte, acestea sunt corecte asimptotic .

Eficiență și comportament asimptotic

Estimatorii de maximă probabilitate nu ating, în general, limita inferioară pentru varianța stabilită de rezultatul Cramér-Rao , dar o realizează asimptotic, adică varianța se abate de la limita inferioară Cramér-Rao cu o cantitate infinitesimală pe măsură ce n crește. Mai mult, estimatorii de probabilitate maximă suntdistribuiți în mod normal asimptotic.

Notă

Bibliografie

  • DC Boes, FA Graybill, AM Mood (1988), Introducere în statistici , McGraw-Hill Libri Italia, ISBN 88-386-0661-7 (text despre fundamentele statisticii matematice, cu mai multe capitole despre metodele de cercetare a estimatorilor )

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 57804