Eșantionare în cluster

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Eșantionarea în cluster este un tip de eșantionare statistică (sau probabilistică ) care, comparativ cu proiectarea eșantionării, nu implică extragerea de unități unice din populația de referință, ci de grupuri , adică aglomerări de unități statistice. Exemple de clustere sunt: ​​familiile, clasele școlare, departamentele de lucru sau camerele spitalului. Toate unitățile care alcătuiesc clusterul extras devin parte a eșantionului. Dacă din fiecare grup de extracte devin parte a eșantionului doar un anumit număr de unități, efectuați eșantionarea în două etape în care, în prima etapă se efectuează extracția clusterelor „în întregime”, în timp ce în a doua etapă, elementarul unitățile sunt extrase din grupurile menționate anterior.

Cel mai mare avantaj care poate fi obținut din eșantionarea clusterelor este atunci când fiecare cluster din interiorul său nu este omogen, adică unitățile care alcătuiesc clusterul diferă între ele pentru o modalitate detectată pe aceeași caracteristică. Abia atunci eșantionarea de mai sus oferă estimări mai eficiente decât eșantionarea simplă aleatorie. Cu alte cuvinte, acest tip de eșantionare oferă estimări mai eficiente dacă și numai dacă fiecare cluster exprimă mai multă variabilitate decât poate fi exprimată cu un eșantion extras din aceeași populație printr-o extracție simplă aleatorie. Cu toate acestea, în mod normal, grupurile care sunt utilizate pentru anchetele statistice sunt compuse din unități omogene și, prin urmare, se produc estimări mai puțin eficiente decât eșantionarea simplă. În ciuda acestui fapt, acest tip de eșantionare este adesea utilizat datorită ușurinței organizării și costului redus, atât din punct de vedere economic, cât și în ceea ce privește viteza de colectare, prelucrare și diseminare a datelor. Acest lucru este valabil din punct de vedere strict teoretic, întrucât din punct de vedere practic există diferite moduri de a evalua eficiența unui plan de eșantionare cluster în comparație cu unul simplu aleator, cum ar fi, de exemplu, analiza descompunerii varianța, coeficientul de omogenitate și Deff (efectul proiectării eșantionării).

Coeficientul de omogenitate în ciorchini

Coeficientul de omogenitate din clustere permite măsurarea gradului de omogenitate din clustere. Prin urmare, afectează eficiența estimărilor de eșantionare.

Să presupunem că efectuăm o eșantionare a clusterului în care toate clusterele sunt compuse din același număr de unități, considerăm o extracție fără repetare.

Fie N numărul de clustere care formează populația, n numărul de clustere care formează eșantionul și fie M numărul de unități elementare ale unui cluster. Să presupunem că dorim să detectăm un caracter cantitativ Y , să fie Y ij valoarea lui Y detectată pe unitatea j-th a cluster-ului i. Fie Y i suma tuturor valorilor măsurate pe unitățile grupului i.

Estimatorul corect al totalului caracterului este

. Varianța acestui estimator și, prin urmare, eficiența estimării sale depind de coeficientul de omogenitate din clustere . este varianța unităților elementare din populație e varianța în clustere, apoi:

unde este și . Coeficientul variază între: .

Varianța estimatorului este egal cu:

care este egală cu suma varianței estimatorului în eșantionare simplă (fără repetare) plus o mărime care depinde de coeficientul de omogenitate. De sine atunci avem o creștere a varianței în ceea ce privește eșantionarea simplă; de sine atunci eșantionarea în grup și eșantionarea simplă au aceeași eficiență; atunci eșantionarea în grup reduce variația față de aleatoare simple și, prin urmare, este mai eficientă, acest lucru se întâmplă atunci când variabilitatea în cadrul clusterelor este mai mare decât variabilitatea în cadrul populației.

Elemente conexe

linkuri externe