Funcția de distribuție empirică

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Linia verde identifică funcția de distribuție a unei variabile aleatoare normale . Linia albastră este funcția de distribuție empirică calculată din eșantionul normal indicat în gri pe axa X.

În statistică și teoria probabilității , funcția de distribuție empirică (sau funcția empirică cumulativă sau ECDF ) este o funcție variabilă reală care reprezintă funcția de distribuție a măsurii empirice a unui eșantion . Funcția de distribuție empirică este o estimare a funcției de distribuție adevărată care a generat eșantionul și datorită teoremei Glivenko-Cantelli este posibil să se afirme că converge pentru cu probabilitatea 1 la distribuția eșantionului [1] .

Definiție

Lasa-i sa fie variabile independente și distribuite identic cu aceeași funcție de distribuție . Apoi, funcția de distribuție empirică poate fi scrisă ca [2] [3] :

unde este este funcția indicator , egală cu 1 dacă este egal cu 0 în caz contrar. Poate fi scris în mod echivalent în forma sa extinsă ca [4] :

Proprietate

Funcția de distribuție empirică este un estimator corect și consistent al funcției de distribuție.

Notă

  1. ^ (EN) Azeem M. Shaikh, The Glivenko-Cantelli Theorem (PDF) pe home.uchicago.edu, Universitatea din Chicago.
  2. ^ Federico M. Stefanini, Frecvențe relative și distribuții empirice , pe local.disia.unifi.it , Universitatea din Florența.
  3. ^ (EN) van der Vaart, Asymptotic statistics , Cambridge University Press, 1998, p. 265 , ISBN 0-521-78450-6 .
  4. ^ Diego Zappa și Silvia Facchinetti, Note statistice , 2013, p. 176, ISBN 9788867800506 .

Alte proiecte