Cenzură (statistici)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

În statistici , inginerie , economie și cercetare medicală , cenzura apare atunci când valoarea unei măsurători sau a unei observații este cunoscută doar parțial.

De exemplu, să presupunem că se efectuează un studiu pentru a măsura impactul unui medicament asupra mortalității cauzate de boli. În acest studiu, se poate ști că vârsta unei persoane la moarte este de cel puțin 75 de ani. O astfel de situație ar putea apărea dacă individul s-ar fi retras din studiu la vârsta de 75 de ani sau dacă individul ar fi trăit în prezent la vârsta de 75 de ani.

Cenzura apare și atunci când o valoare se încadrează în afara unui instrument de măsurare . De exemplu, un cântar de baie ar putea măsura doar până la 140 de kilograme. Dacă un individ care cântărește 160 de kilograme se cântărește el însuși folosind cântarul respectiv, observatorul ar ști doar că greutatea individului este de cel puțin 140 de kilograme.

Tipuri

  • Cenzura de stânga : o observație este sub o anumită valoare, dar nu se știe cu cât.
  • Cenzura pe intervale : o observație se încadrează între două valori, dar nu se știe exact unde.
  • Cenzura din dreapta : o observație depășește o anumită valoare, dar nu se știe cu cât.
  • Cenzura de tip I : în contextul analizei supraviețuirii are loc atunci când un experiment cu un număr definit de subiecți sau elemente se oprește într-un moment prestabilit, după care subiecții încă în viață sunt cenzurați în dreapta.
  • Cenzura de tip II : în același context, apare atunci când experimentul se încheie doar atunci când rămâne un anumit număr de subiecți vii, care sunt astfel cenzurați în dreapta.
  • Aleatoare (sau non-informativ) cenzura: atunci când fiecare subiect are un timp de cenzura care este stocastic independentă din momentul morții sale. Timpul de supraviețuire observat este minimul dintre timpul cenzurii și cel al morții. Subiecții care renunță la studiu înainte de moartea lor sunt cei care rămân cenzurați în dreapta.

Cenzura nu trebuie confundată cu ideea conexă a trunchierii . Cu cenzura, se știe că observațiile cenzurate depășesc un anumit prag sau se află într-un anumit interval, iar aceste informații parțiale pot fi utilizate atunci când se modelează statistic fenomenul. Cu trunchierea, observațiile nu dau naștere niciodată la valori în afara unui anumit interval; valorile populației în afara acestui interval sunt complet eliminate. Rețineți că în statistici trunchierea este diferită de rotunjire .

Problema datelor cenzurate, unde valoarea observată a unei anumite variabile este parțial cunoscută, este legată de problema datelor pierdute , unde valoarea observată a unei anumite variabile este necunoscută.

Cenzura pe intervale poate apărea atunci când observarea unei valori necesită verificări sau inspecții ulterioare. Cenzura din stânga și din dreapta sunt cazuri speciale de cenzură a intervalului, unde capătul stâng (începutul) intervalului este respectiv la zero, iar capătul drept (capătul) este la infinit.

Datele cenzurate din stânga sunt văzute, de exemplu, în datele analitice de mediu în care concentrațiile urme de substanțe chimice pot fi prezente într-un eșantion de mediu (de exemplu, apă subterană, sol), dar sunt „nedetectabile”, de ex. deoarece sunt sub limita de detectare a instrumentului analitic sau a metodei de laborator. Metodele de estimare pentru utilizarea datelor cenzurate din stânga variază și, pe de altă parte, nu toate metodele de estimare pot fi aplicabile sau cele mai fiabile pentru toate seturile de date. [1]

Epidemiologie

Una dintre primele încercări de a analiza o problemă statistică referitoare la datele cenzurate a fost analiza din 1766 a lui Daniel Bernoulli privind datele privind morbiditatea și mortalitatea variolei pentru a demonstra eficacitatea vaccinării . [2]

Testarea duratei de funcționare

Exemplu de cinci teste replicate care au dus la patru eșecuri și un timp suspendat.

Testele de fiabilitate constau adesea în efectuarea unui test pe un articol (în condiții specificate) pentru a determina timpul necesar unui eșec.

  • Uneori este planificată și așteptată o defecțiune, dar nu apare: eroare operator, defecțiune a echipamentului, anomalie de testare etc. Rezultatul testului nu a fost timpul de eșec dorit, dar poate (și ar trebui) să fie folosit ca timp de sfârșit. Utilizarea datelor cenzurate este neintenționată, dar necesară.
  • Uneori, inginerii planifică un program de testare, astfel încât, după o anumită limită de timp sau un anumit număr de eșecuri, toate celelalte teste să se termine. Aceste situații, definite ca timpi de suspendare, sunt tratate ca date cenzurate de dreapta. În acest caz, utilizarea datelor cenzurate este intenționată. O analiză a datelor replicate include atât timpii de eșec pentru elementele care au eșuat, cât și timpul de eșec pentru cei care nu au reușit.

Analize

Tehnici speciale pot fi utilizate pentru a trata datele cenzurate. Testele cu timpi de eșec specifici sunt codificați ca eșecuri efective; datele cenzurate sunt codificate pentru tipul de cenzură și intervalul sau limita cunoscute. Programele software speciale (adesea orientate spre fiabilitate ) pot duce la estimări de probabilitate maximă pentru statistici sumare, intervale de încredere etc.

Notă

  1. ^ Helsel, D. Foarte multe zbuciumuri pe lângă Nimic: încorporarea nedetectărilor în știință , Ann. Ocupa. Hyg., Vol. 54, Nr. 3, pp. 257-262, 2010
  2. ^ Bernoulli D. (1766) "Essai d'une nouvelle analyse de la mortalité causée par la petite verole. Mem. Math. Phy. Acad. Roy. Sci. Paris , retipărit în Bradley (1971) 21 și Blower (2004)

Bibliografie

  • Blower, S. (2004), D, Bernoulli's "( PDF )", Review of Medical Virolology , 14 : 275-288
  • Bradley, L. (1971) Inocularea variolei: o controversă matematică din secolul al XVIII-lea , Nottingham
  • Mann, NR și colab. , Metode pentru analiza statistică a datelor privind fiabilitatea și viața , New York, Wiley, 1975, ISBN 0-471-56737-X .
  • Bagdonavicius, V., Kruopis, J., Nikulin, MS (2011), "Teste non-parametrice pentru date cenzurate", Londra, ISTE / WILEY , ISBN 9781848212893 .

Elemente conexe

linkuri externe