Winsorization

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Winsorizarea este o procedură statistică pentru modificarea artificială a distribuției eșantionului de variabile aleatorii . Acesta constă în eliminarea valorilor aberante, adică acele valori extreme sau „anormale”, care diferă semnificativ de valorile centrale ale distribuției. Valorile aberante sunt nedorite în analizele empirice, deoarece au un impact asupra estimării parametrilor de regresie, determinându-i să fie mai puțin stabili.

Procedura pentru câștigarea datelor este următoarea:

  • identificarea a priori a unui prag, datele dincolo de care sunt considerate valori anormale;
  • pragul este identificat cu valoarea definită ca: t = mediană +/- z * ( interval intercuartil ), unde "z" este valoarea critică a distribuției normale (în general 2, 2,5 sau 3);
  • deviația mediană și intercuartilă sunt preferabile abaterii medii și respectiv a deviației standard , deoarece sunt mai puțin influențate de valori anormale;
  • winsorization adevărat: observațiile mai mari decât t și mai mici decât -t sunt înlocuite cu t și respectiv -t.

Procedura poartă numele inginerului Charles P. Winsor (1895-1951).

Elemente conexe

linkuri externe

Statistici Portal de statistici : accesați intrările Wikipedia care se ocupă de statistici