Outlier
Outlier este un termen folosit în statistici pentru a defini, într-un set de observații, o valoare anormală și aberantă, adică o valoare clar îndepărtată de celelalte observații disponibile. [1]
În statistici, o valoare anterioară este definită ca o valoare în afara intervalului:
Unde este Și sunt respectiv primul și al treilea quartile și este o constantă care reglează lățimea intervalului. În mod normal, apare
Valorile aberante sunt valori numerice îndepărtate de restul datelor colectate (de exemplu, într-un eșantion ). Statisticile din eșantioanele care conțin valori anormale pot fi înșelătoare. De exemplu, dacă am măsura temperatura a zece obiecte dintr-o cameră, dintre care s-a constatat că majoritatea au o temperatură cuprinsă între 20 și 25 de grade Celsius, atunci cuptorul care arde, având o temperatură de 350 de grade, ar fi o cifră aberantă. Mediana valorilor ar fi de aproximativ 23, în timp ce temperatura medie ar crește la aproximativ 55 de grade: un indice clar nu este reprezentativ pentru majoritatea valorilor de temperatură găsite în cameră. În acest caz, mediana ar reflecta mai bine măsurătorile de temperatură ale obiectelor decât media aritmetică . Valorile aberante pot fi indicative ale faptului că, într-un eșantion dat, unele date aparțin unei populații diferite de cea a restului eșantionului.
În majoritatea eșantioanelor mari, unele date vor fi mai departe de media eșantionului decât ar fi logic de așteptat. Acest lucru se poate datora unei erori sistematice care a apărut în colectarea datelor sau unei erori în teoria care a ghidat asumarea unei distribuții de probabilitate de eșantionare date, dar s-ar putea datora, pur și simplu, întâmplării, ceea ce a făcut acest lucru în colectarea datelor. unele observații au produs date foarte departe de valorile medii ale eșantionului. În plus, valorile aberante ar putea fi indicative pentru date eronate, proceduri eronate sau zone experimentale în care unele teorii ar putea să nu fie valabile. Cu toate acestea, un număr mic de valori aberante, care nu sunt cauzate de condiții anormale, sunt luate de la sine în probe mari.
Se estimează că estimatorii puțin influențați de valori externe sunt robuste .
Notă
Elemente conexe
Alte proiecte
- Wikimedia Commons conține imagini sau alte fișiere despre Outlier
Controlul autorității | Tezaur BNCF 57147 · LCCN (EN) sh85096171 · GND (DE) 4510494-3 · BNF (FR) cb12127529t (data) |
---|