Analiza supraviețuirii

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Analiza supraviețuirii este o aplicație a statisticilor utilizate pentru a studia mortalitatea în organismele biologice și eșecurile în sistemele mecanice. Acest subiect este numit în inginerie „ teoria fiabilității ” sau „analiza fiabilității”, în timp ce în economie sau sociologie se numește analiza duratei sau modelul duratei .

Descriere

Analiza supraviețuirii implică, în general, modelarea timpului cu date eveniment; în acest context, moartea sau eșecul sunt considerate un „eveniment” în literatura de analize a supraviețuirii. Un alt exemplu de timp în modelul evenimentului ar putea fi rata sau timpul necesar foștilor deținuți pentru a comite o crimă din nou după ce sunt eliberați. În acest caz, evenimentul care ne interesează ar putea fi timpul necesar comiterii unei infracțiuni. Multe concepte în analiza supraviețuirii au fost explicate de teoria procesului de numărare care a apărut mai recent. Flexibilitatea unui proces de numărare este că vă permite să modelați evenimente multiple (sau recurente). Acest tip de model se potrivește foarte bine în diferite situații (de exemplu, oamenii pot fi închiși de mai multe ori, alcoolicii pot înceta să bea de mai multe ori, oamenii se pot căsători și pot divorța de mai multe ori).

Analiza supraviețuirii încearcă să răspundă la întrebări precum: ce parte a populației va supraviețui după un anumit timp? Dintre cei care supraviețuiesc, care va fi tendința deceselor și a bolilor? Se pot lua în considerare mai multe cauze de deces sau boală? Cum ar putea circumstanțele sau caracteristicile particulare să crească sau să scadă șansele de supraviețuire?

Pentru a răspunde la aceste întrebări, este necesar să se definească un timp de viață . În cazul vieții biologice, moartea nu este ambiguă, dar din cauza fiabilității mecanice, eșecul sau eșecul nu pot fi bine definite, deoarece există sisteme mecanice în care eșecul poate fi parțial, controversat sau nu ușor de localizat în timp . Chiar și în procesele biologice, unele evenimente (de exemplu infarctul miocardic sau alte tulburări organice) pot avea aceeași ambiguitate. Teoria de mai sus presupune evenimente bine definite la momente specifice; alte cazuri pot fi tratate mai bine prin modele care iau în mod explicit în considerare evenimentele ambigue.

Teoria supraviețuirii presupune, de asemenea, în mod simplist, că moartea sau destrămarea apare o singură dată pentru fiecare subiect. Studiul evenimentelor recurente este relevant în proiectarea sistemelor fiabile și în multe domenii ale științelor sociale și cercetării medicale.

Formulare generală

Funcția de supraviețuire

Obiectul principal de interes în funcția de supraviețuire este notat în mod convențional cu S , este definit ca

unde t sau, în unele cazuri, indicat de T este o variabilă aleatorie care indică momentul morții și Pr reprezintă probabilitatea . Rezultă că: funcția de supraviețuire este probabilitatea ca timpul morții să fie după un moment dat. Funcția de supraviețuire este numită și funcția de supraviețuitor sau funcția de barcă a supraviețuitorului în problemele de supraviețuire biologică și funcția de realizare în problemele de supraviețuire mecanică. În acest din urmă caz, funcția de realizare este notată cu r ( t ).

De obicei, setăm s (0) = 1, cu toate acestea ar putea fi mai mic de 1 dacă există posibilitatea decesului sau eșecului imediat.

Funcția de supraviețuire nu trebuie să crească: S ( u ) ≤ S ( t ) dacă u > t . Această proprietate derivă direct din faptul că S ( t ) este integralul unei funcții non-negative. Aceasta reflectă noțiunea că supraviețuirea în momentul final este posibilă doar dacă cineva supraviețuiește tuturor momentelor anterioare. Având în vedere această proprietate, funcția de distribuție a timpului de viață și a densității evenimentelor (denumite în continuare co F și respectiv f ) sunt bine definite.

De obicei, se impune că funcția de supraviețuire tinde la zero pe măsură ce timpul crește la nesfârșit, adică

S ( t ) → 0 pentru t → ∞

altfel limita ar putea fi mai mare decât zero dacă viața veșnică ar fi posibilă.

Funcția de distribuție a duratei de viață și densitatea evenimentelor

Cantitățile relative sunt definite în funcție de funcția de supraviețuire. Funcția de distribuție a duratei de viață, notată în mod convențional cu F , este definită ca complement al funcției de supraviețuire.

iar derivata lui F (adică funcția de densitate a distribuției timpului de viață) este notată în mod convențional prin f

f se numește uneori densitate de evenimente;

este cantitatea de decese sau defalcări pe unitate de timp.

Funcția de risc și funcția de risc cumulativă

Funcția de risc , notată în mod convențional prin , Este definit ca rata evenimentelor la momentul t supraviețuire condiționată până la momentul t sau peste,

Forța mortalității este un sinonim pentru „funcția de risc”, care este utilizată în special în demografie și știința actuarială . Termenul „parte de risc” este un alt sinonim.

Funcția de risc trebuie să fie non-negativă, λ ( t ) ≥ 0 și integrala sa între trebuie să fie infinit sau altfel nu limitat; funcția de risc poate fi crescătoare sau descrescătoare, nu monotonă sau discontinuă. Un exemplu este funcția de risc curbat a tubului chiuvetei , care este mai largă pentru valori mai mici de t , scade la un anumit minim și apoi crește din nou; aceasta poate descrie proprietatea unor sisteme mecanice, precum și eșecul imediat după o operație sau mai târziu, pe măsură ce sistemul îmbătrânește.

Funcția de risc poate fi alternativ reprezentată în funcție de funcția de risc cumulată, convențional indicată cu :

asa

se numește funcția de risc cumulativ deoarece definițiile de mai sus implică împreună

,

care este acumularea riscului în timp.

atâta timp cât se observă că crește la nesfârșit, tinde spre infinit (prin plasarea tendind la zero). asta presupune că nu scade prea repede, deoarece riscul cumulativ diverg. De exemplu nu este funcția de risc a unei anumite distribuții de supraviețuire, deoarece integrala sa converge (la 1).

Cantități derivate din distribuția supraviețuirii

Durata de viață viitoare la un moment t 0 este indicată de timpul rămas înainte de moarte, durata de viață viitoare este în notația curentă. Durata de viață viitoare așteptată este valoarea așteptată a duratei de timp viitoare. Probabilitatea de deces mai devreme sau mai târziu , o supraviețuire dată până la , e corect

În consecință, densitatea probabilității unei durate de viață este

iar durata de viață viitoare așteptată este

pentru , adică la naștere, aceasta se reduce la durata de viață așteptată.

În problemele de realizare, durata de viață așteptată se numește timpul de eșec așteptat, iar durata de viață viitoare se numește timpul de așteptare rezidual .

Probabilitatea supraviețuirii individuale până la t sau dincolo este S ( t ), prin definiție. Numărul așteptat de supraviețuitori într-o populație de n indivizi este n × S ( t ), presupunând aceeași funcție de supraviețuire pentru toți. Astfel, proporția așteptată a supraviețuitorilor este S ( t ), iar varianța proporției supraviețuitorilor este S ( t ) × (1- S ( t )) / n .

vârsta la care rămâne o proporție specifică q de supraviețuitori poate fi determinată prin rezolvarea ecuației S ( t ) = q față de t unde q este proporția în cauză. de obicei, suntem interesați de durata medie de viață, pentru care q = 1/2 sau de alte proporții, cum ar fi q = 0,90 sau q = 0,99.

Inferențe mai complexe pot fi extrase și din distribuția supraviețuirii. În problemele de fabricație mecanică, costurile (sau, mai general, utilitatea ) pot fi luate în considerare și problemele legate de reparații și înlocuiri pot fi rezolvate. Consultați problema timpului de înlocuire și teoria durabilității și reînnoirii și teoria realizării durabilității și longevității pentru discuții suplimentare pe această temă.

Unele distribuții de supraviețuire

Modelele de supraviețuire parametrice sunt construite prin alegerea unei distribuții de probabilitate specifice pentru funcția de supraviețuire. Este corect să vorbim despre ajustarea și analiza modelului în termeni generali, folosind conceptul evidențiat mai jos de parametrii de ajustare la date . Astfel, este relativ ușor să înlocuiți o distribuție cu alta pentru a studia consecințele diferitelor alegeri.

Alegerea distribuției supraviețuirii exprimă unele informații particulare despre relația timpului pentru orice variabilă exogenă în ceea ce privește supraviețuirea. Este firesc să alegeți o distribuție statistică care să nu aibă suport negativ, deoarece timpul de supraviețuire nu este negativ. există mai multe distribuții utilizate în mod obișnuit în analiza supraviețuirii, care sunt prezentate în tabelul următor. Distribuții suplimentare pot fi găsite în referințe.

Distribuție Funcția de supraviețuire S ( t )
Distribuție exponențială (caz special Weibull)
Distribuție Weibull
Distribuția Gompertz
Distribuție log-normală
Distributie logistica

Unde este este funcția de distribuție cumulativă a distribuției normale .

Cenzură

cenzura este o formă de problemă a datelor lipsă, care este răspândită în analiza supraviețuirii. În mod ideal sunt cunoscute atât data nașterii, cât și cea a morții unui subiect, caz în care se cunoaște durata vieții sale. Dacă se știe doar că data morții este după o astfel de dată, se numește cenzură de dreapta . Cenzura de dreapta este pentru acei subiecți a căror dată de naștere este cunoscută, dar care sunt încă în viață atunci când sunt pierduți din vedere sau când studiul se încheie. Dacă se știe că durata de viață a unui subiect este mai mică de o anumită durată, se spune că durata de viață este cenzurată în stânga. De asemenea, se poate întâmpla ca subiecții cu o durată de viață mai mică de un anumit prag să nu poată fi observați pe deplin: aceasta se numește trunchiere . Rețineți că trunchierea este diferită de cenzura din stânga, deoarece pentru o dată cenzurată din dreapta, știți că subiectul există, dar pentru o dată trunchiată, nu știți complet subiectul. Trunchierea este de asemenea frecventă. Într-un studiu de inserție întârziat definit, subiecții nu sunt pe deplin observați până când nu ating o anumită vârstă. De exemplu, eșantionul nu este observat până la atingerea vârstei școlare. Orice persoană în vârstă preșcolară poate rămâne necunoscută.

Adaptarea parametrilor la date

Modelele de supraviețuire pot fi ușor văzute ca modele de regresie obișnuite în care variabila de răspuns este timpul. Cu toate acestea, calcularea funcției de probabilitate (necesară pentru a se potrivi parametrilor sau pentru a face alte tipuri de inferență) este complicată de cenzură. Funcția de probabilitate pentru un model de supraviețuire, în prezența datelor cenzurate, este formulată după cum urmează. Prin definiție, funcția de probabilitate este probabilitatea comună a datelor furnizate de parametrii modelului. Este tradițional să presupunem că datele sunt furnizate independent de parametri. Atunci funcția de probabilitate este produsul probabilității fiecărei date. Este convenabil să împărțiți datele în patru categorii: necenzurate, cenzurate în stânga, cenzurate în dreapta și cenzurate la intervale de timp. Acestea sunt notate cu unc , lc rc , respectiv ic în următoarea ecuație.

Pentru o înregistrare curată cu egală cu vârsta morții, avem

Pentru o dată cenzurată din stânga, cum ar fi când se știe că vârsta morții este mai mică de , da

Pentru date cenzurate din dreapta, cum ar fi cazul în care se știe că ar urma vârsta morții , da

Pentru date cenzurate într-un interval, cum ar fi cazul în care se știe că vârsta morții este mai mare de și mai mic decât , da

Bibliografie

  • David Collett, Modeling Survival Data in Medical Research , Boca Raton, Chapman & Hall \ CRC, 2003.
  • Regina Elandt-Johnson, Norman Johnson, Survival Models and Data Analysis , New York, John Wiley & Sons, 1980/1999.
  • Jerald F. Lawless, Modele statistice și metode pentru date pe viață , ediția a II-a, Hoboken, John Wiley și Sons, 2003.
  • Terry Therneau, Un pachet pentru analiza supraviețuirii în S.
  • Manual de statistici inginerești , NIST / SEMATEK, NIST / SEMATECH e-Manual de metode statistice

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 52496 · LCCN (EN) sh90003967 · BNF (FR) cb12358964n (data)
Statistici Portal de statistici : accesați intrările Wikipedia care se ocupă de statistici