Outlier

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Outlier este un termen folosit în statistici pentru a defini, într-un set de observații, o valoare anormală și aberantă, adică o valoare clar îndepărtată de celelalte observații disponibile. [1]

În statistici, o valoare anterioară este definită ca o valoare în afara intervalului:

[2]

Unde este Și sunt respectiv primul și al treilea quartile și este o constantă care reglează lățimea intervalului. În mod normal, apare

Valorile aberante sunt valori numerice îndepărtate de restul datelor colectate (de exemplu, într-un eșantion ). Statisticile din eșantioanele care conțin valori anormale pot fi înșelătoare. De exemplu, dacă am măsura temperatura a zece obiecte dintr-o cameră, dintre care s-a constatat că majoritatea au o temperatură cuprinsă între 20 și 25 de grade Celsius, atunci cuptorul care arde, având o temperatură de 350 de grade, ar fi o cifră aberantă. Mediana valorilor ar fi de aproximativ 23, în timp ce temperatura medie ar crește la aproximativ 55 de grade: un indice clar nu este reprezentativ pentru majoritatea valorilor de temperatură găsite în cameră. În acest caz, mediana ar reflecta mai bine măsurătorile de temperatură ale obiectelor decât media aritmetică . Valorile aberante pot fi indicative ale faptului că, într-un eșantion dat, unele date aparțin unei populații diferite de cea a restului eșantionului.

În majoritatea eșantioanelor mari, unele date vor fi mai departe de media eșantionului decât ar fi logic de așteptat. Acest lucru se poate datora unei erori sistematice care a apărut în colectarea datelor sau unei erori în teoria care a ghidat asumarea unei distribuții de probabilitate de eșantionare date, dar s-ar putea datora, pur și simplu, întâmplării, ceea ce a făcut acest lucru în colectarea datelor. unele observații au produs date foarte departe de valorile medii ale eșantionului. În plus, valorile aberante ar putea fi indicative pentru date eronate, proceduri eronate sau zone experimentale în care unele teorii ar putea să nu fie valabile. Cu toate acestea, un număr mic de valori aberante, care nu sunt cauzate de condiții anormale, sunt luate de la sine în probe mari.

Se estimeazăestimatorii puțin influențați de valori externe sunt robuste .

Notă

  1. ^ Statisticienii italieni preferă în mod tradițional să vorbească despre date anormale sau aberante . Înțelesul este același.
  2. ^ Carte de statistici - Paul Newbold

Elemente conexe

Alte proiecte

Controlul autorității Tezaur BNCF 57147 · LCCN (EN) sh85096171 · GND (DE) 4510494-3 · BNF (FR) cb12127529t (data)