Modelul Probit

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Modelul probit este reprezentat cu roșu punctat.

În statistici și econometrie , modelul probit este un model de regresie neliniar utilizat atunci când variabila dependentă este dihotomică . Obiectivul modelului este de a stabili probabilitatea cu care o observație poate genera una sau cealaltă valoare a variabilei dependente; poate fi folosit și pentru clasificarea observațiilor, pe baza caracteristicilor acestora, în două categorii. [1]
Modelul a fost propus pentru prima dată de Chester Ittner Bliss în 1934 , [2] extins în anul următor de Ronald Fisher care a introdus o metodă iterativă pentru estimarea parametrilor folosind metoda maximă probabilitate .

Alegerea funcției

Funcția probit. Inversul acestei funcții este utilizat în modelul probit.

Un model de regresie în care variabila dependentă este dihotomică, adică o variabilă care poate avea 0 și 1 ca singure valori sau care le pot fi atribuite, calculează probabilitatea ca această variabilă să dobândească valoarea 1.

Având în vedere această limitare a valorilor de , funcția care trebuie adoptată pentru regresie trebuie să fie neliniară cu intervalul , o caracteristică pe care o dețin funcțiile de defalcare . [1] Nevoia de neliniaritate derivă din faptul că funcția, pentru a rămâne în intervalul dat, trebuie să aibă mai întâi o derivată neconstantă, deci dependentă de regresori. În caz contrar, funcția ar fi o linie dreaptă și domeniul său ar deveni . De fapt, să presupunem următorul model liniar:

unde derivatul

este constantă și egală cu parametrul . Pe baza semnului acestui parametru, funcția va crește dacă este pozitivă sau va scădea dacă este negativă, dar nu este posibil să avem ca interval deoarece acest lucru ar necesita o derivată dependentă de valoarea lui . Dacă luăm în considerare următorul model:

unde derivatul

este, de asemenea, dependent de variabilă , este posibil, ca și , variază panta curbei, limitându-o la intervalul dat. Pentru modelul probit este utilizat ca funcție funcția de distribuție a distribuției normale standard, adică inversa funcției probit. [1]

Definiție

Modelul de regresie probit pentru populație este: [1]

unde este:

  • indică probabilitatea;
  • este variabila dependentă dihotomică cu o distribuție Bernoulli ;
  • este vectorul variabilelor independente sau regresorilor ;
  • este vectorul parametrilor ;
  • este funcția de distribuție a distribuției normale standard.

Varianța

Varianța variabilei dependente depinde de vectorul regresorilor . Intr-adevar

.

Efect marginal

Efectul asupra variabilei dependente dat de o schimbare într-un regresor , numit efect marginal, se calculează ca derivată a valorii așteptate a în comparație cu :

unde este este funcția densității probabilității distribuției normale standard e este parametrul care înmulțește regresorul . [1] Pentru calcularea derivatei, regresorul trebuie să fie continuu.

Ilustrația metodei

Pentru fiecare probă de observare ai o determinare și de determinări . Modelul caută o relație neliniară, utilizând funcția de distribuție normală standard, între variabila dependentă și variabile independente, estimând valoarea coeficienților folosind metoda de maximă probabilitate. [1]

Estimarea parametrilor

Vectorul parametrilor se estimează de obicei cu metoda maximă probabilitate , cu care se obțin estimatori eficienți , consecvenți și distribuiți în mod normal dacă eșantionul statistic este suficient de mare. [3] Aceste proprietăți permit calcularea testului t pe un parametru, a testului F în cazul restricțiilor multiple și a intervalelor de încredere . [3]

Funcția de probabilitate

În modelul probit variabila dependentă este dihotomic și cu distribuție . Luați în considerare un eșantion de observații unde fiecare dintre ele este identificat . Pentru definiția modelului, probabilitatea ca această variabilă să fie 1 pentru o observație dată Și

,

în timp ce probabilitatea să fie 0 este

.

Distribuția condițională a probabilității pentru fiecare element poate fi scris ca

.

Acum luăm în considerare întregul eșantion și presupunem și pentru fiecare observație , sunt independente și distribuite identic . Astfel, rezultă că distribuția comună a probabilității este produsul probabilităților condiționale ale fiecărei observații:

.

Definiția modelului probit este acum preluată și înlocuită în locul , obținând astfel funcția de probabilitate [4]

.

Metoda de maximă probabilitate

Pentru a calcula estimatorii parametrii este convenabil să calculați funcția log-probabilitate, deoarece în acest fel este posibilă eliminarea productivității. Logaritmul este apoi aplicat funcției de probabilitate:

.

Estimatorii calculați cu metoda de maximă probabilitate maximizează funcția anterioară rezolvând următoarea problemă:

. [5]

Pentru a simplifica scrierea să luăm în considerare un vector al parametrilor , derivatul de , adică funcția densității probabilității distribuției normale standard și numărul de observații din eșantion. Există două condiții pentru maximizare: prima ordine în care prima derivată în raport cu parametrii trebuie setată egală cu zero pentru a găsi extremele, a doua plasează în schimb a doua derivată, din nou în raport cu parametrii, mai mică decât zero la determina concavitatea functiei.

De obicei, soluțiile acestor condiții nu sunt ușor de determinat sau nu pot fi găsite deloc, dar pentru a depăși această problemă puteți utiliza programe statistice de computer care, prin intermediul unor algoritmi , își găsesc aproximările. [5]

Notă

  1. ^ a b c d e f ( EN ) James H. Stock și Mark W. Watson, Regression with a Binary Dependent Variable , în Introduction to Econometrics , ediția a 3-a, Pearson, 2015, pp. 437-439, ISBN 978-1-292-07131-2 .
  2. ^ Chester I. Bliss , METODA PROBITELOR , în Știință , vol. 79, 12 ianuarie 1934, pp. 38-39, DOI : 10.1126 / science.79.2037.38 , PMID 17813446 . Adus la 20 noiembrie 2018 .
  3. ^ A b (EN) James H. Stock și Mark W. Watson, Regression with a Binary Dependent Variable, în Introduction to Econometrics, ediția a 3-a, Pearson, 2015, pp. 441-442, ISBN 978-1-292-07131-2 .
  4. ^ Întreaga derivare a funcției de probabilitate poate fi consultată pe paginile raportate aici. ( EN ) James H. Stock și Mark W. Watson, Regression with a Binary Dependent Variable , în Introduction to Econometrics , ediția a 3-a, Pearson, 2015, pp. 465-466, ISBN 978-1-292-07131-2 .
  5. ^ A b (EN) James H. Stock și Mark W. Watson, Regression with a Binary Dependent Variable, în Introduction to Econometrics, ediția a 3-a, Pearson, 2015, pp. 465-466, ISBN 978-1-292-07131-2 .

Bibliografie

  • ( EN ) William H. Greene, capitolul 21 , în Analiza econometrică , ediția a IV-a, Prentice-Hall, 1993 [1990] , ISBN 0-13-013297-7 .
  • ( EN ) James H. Stock și Mark W. Watson, Regression with a Binary Dependent Variable , în Introduction to Econometrics , ediția a 3-a, Pearson, 2015, ISBN 978-1-292-07131-2 .

Elemente conexe

Alte proiecte

Controlul autorității Tezaur BNCF 57283 · LCCN (EN) sh85107103 · GND (DE) 4225469-3 · BNF (FR) cb123992565 (data)