Plan de eșantionare

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Elaborarea planurilor de eșantionare (amploarea eșantionării) este una dintre primele probleme care apar în controlul calității unei companii care activează în producția industrială chemată să verifice anumite caracteristici ale calității unui lot de bunuri achiziționate (materie primă) sau realizate (produs finit), prin inspecția sau analiza unei porțiuni foarte limitate, numită eșantion, a întregului (pentru „populația” statisticienilor).

Este ușor de înțeles cât de importantă poate fi procedura pentru extragerea și supunerea la control a probelor care satisfac două nevoi contradictorii, cum ar fi acuratețea maximă și costul minim .

Utilizarea instrumentelor statistice adecvate este un mijloc de neînlocuit pentru a evalua în prealabil semnificația fiecărui plan de eșantionare ipotetic pentru a putea selecta cea mai adecvată metodologie.

Terminologie

(termeni și simboluri alese dintre mulți folosiți în literatură)

Unitate
cea mai mică porțiune a lotului care poate fi prelevată (gram, bucată etc.).
Controlul prin atribute
metodă de verificare care oferă un răspuns în termeni exclusiv calitativi (da / nu, prezent / absent, pozitiv / negativ).
Controlul prin variabile
metoda de verificare care duce la determinarea unei valori numerice referitoare la un nivel cantitativ (dimensiune, măsură analitică).
Control normal, sever, redus
setarea unei severități mai mari sau mai mici corelată cu riscul mai mic sau mai mare al unei evaluări nefavorabile pe care credeți că o puteți executa.
N (dimensiunea lotului)
numărul de unități din care este alcătuit jocul.
n (dimensiunea eșantionului)
numărul de unități extrase din lot.
r (unități defecte)
numărul unităților neconforme conținute în lot.
p (fracțiune defectă)
fracțiunea unitară a defectelor (= r / N ).
p% (procentaj defect)
numărul de unități neconforme din 100 de unități ale lotului (= 100 r / N ).
k (numărul de acceptare sau numărul de apariții)
numărul maxim de unități neconforme din n eșantionate și analizate, care decretează acceptabilitatea lotului.
λ (valoare așteptată)
numărul de unități neconforme din n eșantioane pe care este legitim să le așteptăm de la un lot cu defecte p (= n p ).
P ( limită fiduciară )
probabilitate, exprimată în termeni de fracție unitară, adică variabilă de la zero la unu, ca un lot cu un anumit procent defect (sau fracțiune defectă) să aibă k unități neconforme pe n eșantionat sau că valoarea mărimii măsurate se află în incertitudinea raportată.
P o (probabilitate de acceptare)
probabilitatea, exprimată în termeni fracționali, ca un lot să fie acceptat cu procentul defect (sau fracția defectă) convenit ca acceptabil. Riscul vânzătorului este probabilitatea 1 - P ca un astfel de lot să fie respins.
P c (probabilitatea consumatorului)
probabilitatea, exprimată în termeni fracționari, ca un lot să fie acceptat cu un anumit procent defect (sau fracțiune defectă) mai mare decât cel convenit ca acceptabil. Corespunde riscului cumpărătorului.
la! ( factorial )
produsul unui număr întreg a pentru toți cei care îl precedă, înapoi până la 1 ( 0! este convențional egal cu 1 ).
exp {a}
baza logaritmului natural ( e = 2.718281183) ridicat la putere a .
X
valoarea numerică a variabilei (date de analiză).
(in medie)
suma rezultatelor numerice împărțită la numărul de date. În distribuția normală coincide cu valoarea centrală.
σ ( deviație standard )
măsură corelată cu dispersia datelor în jurul mediei.
Varianța
σ 2
z (multiplicator de deviație standard)
z σ în dreapta sau în stânga mediei identifică un segment pe axa absciselor deasupra căruia zona Gaussiană are o anumită valoare în termeni fracționari (vezi tabelul). Dacă incertitudinea rezultatului depinde în mod critic de dimensiunea eșantionului, este adecvat să se înlocuiască z cu variabila Student t care ia în considerare gradele de libertate n - 1 și care tinde să z tindă n spre infinit.
E (eroare)
diferența maximă acceptabilă între valoarea experimentală și valoarea adevărată, numită și precizie , deși numele de non-precizie pare mai potrivit.

Instrumente statistice

Statistica inferențială utilizează expresii matematice derivate din teoria probabilității , pentru a extrapola, pornind de la date experimentale limitate, afirmații generale de natură „probabilistică”, adică pe baza probabilității că ceea ce se pretinde este adevărat.

Unele dintre aceste funcții, denumite în mod obișnuit variabile aleatorii , pot fi utilizate pentru a studia planurile de eșantionare.

Variabilă aleatorie hipergeometrică

(1)
unde este:

Notă: N afectează relativ puțin P și, în orice caz, pentru valori foarte mari ale lui N , funcția devine echivalentă cu variabila aleatorie binomială corespunzătoare.

Variabilă aleatoare binomială

(2)
unde este:

Notă: dacă n este mare (aproximativ> 50) și p foarte mic, astfel încât np este mai mic de 10 și p (1-p) aproape egal cu p , atunci binomul poate fi aproximat cu o variabilă aleatorie poissoniană unde λ = np .

Variabilă aleatorie poissoniană

(3)
cu λ > 0

Notă:

  1. Dacă n este foarte mare și λ > 10, atunci Poissonianul poate fi aproximat cu o variabilă aleatorie normală cu valoare centrală și varianță egală cu λ .
  2. CEL MAI MULTE PLANURI DE EȘANTIONARE PENTRU VERIFICAREA DE LA ATRIBUȚI SE BAZĂ PE DISTRIBUȚIA POISSON.

Variabilă aleatorie normală (sau gaussiană)

(4)

Notă

  1. În această formă este o variabilă continuă unde x poate lua orice valoare.
  2. Majoritatea planurilor de eșantionare pentru verificarea variabilelor se bazează pe distribuția normală.

Ca o aproximare a Poissonianului devine:

(5)

Notă: în această formă este o variabilă discretă unde k ia doar valori întregi non-negative.

Controlul prin atribute

Cu fiecare dintre funcțiile (1), (2), (3) și (5) este posibil să se determine, odată ce ceilalți parametri ( N , n , p , r , în funcție de cazuri) sunt stabiliți, probabilitatea de obținerea de k apariții (eșantioane neconforme) la n teste (eșantioane totale).

De multe ori este mai interesant ce se obține prin cumularea valorilor de probabilitate referitoare la anumite numere de apariții, adică prin tabelare, pe lângă , diversele , , , , etc. și raportarea probabilităților astfel obținute cu valorile asumate de defect (cum ar fi p% de exemplu). În acest fel, așa-numitele „curbe de funcționare” sunt create cu tabele sau grafice care permit, odată stabilit un plan de eșantionare (în mod substanțial cu n și k , dată fiind importanța redusă a lui N limitată la calcul), să aprecieze probabilitatea să accepte o mulțime cu p% defecte cu acel plan special.

În acest moment, aveți la dispoziție orice pereche de valori ep%, va fi ușor să luați în considerare riscul vânzătorului (probabilitatea de a refuza un lot conform) și riscul cumpărătorului (probabilitatea de acceptare a unui lot neconform) și, pe baza acestora, remodelați în mod coerent planul.

Exemple de aplicare a „Poisson”

Analiza microbiologică a produselor alimentare

Să presupunem că specificația indică Salmonella Absent în 25 de grame și că metoda de control indică faptul că verificarea trebuie efectuată în trei sticle de bulion de cultură adecvat cu 25 g de produs fiecare, pentru un total de 75 g.

Luați în considerare un gram ca unitate care alcătuiește lotul și un gram care conține Salmonella (probabil o Salmonella, dacă materialul este suficient de omogen) este defect.

Avem k = 0 și n = 75 : planul prevede că din 75 de unități de produs numărul de apariții (unități neconforme) este zero.

Pentru k = 0 Poisson este redus la , de la care

O serie de valori p (sau p% ) care corespund anumitor valori ale lui pot fi acum tabelate :

P (0) n p p%
0,99 75 0,000134 0,0134
0,98 75 0,000269 0,0269
P a 0,97 75 0,000406 0,0406
0,96 75 0,000544 0,0544
0,95 75 0,000684 0,0684
.... ... ........ ......
0,50 75 0,009242 0,9242
.... ... ........ ......
P c 0,05 75 0,039943 3,9943
0,04 75 0,042918 4.2918
0,03 75 0,046754 4.6754
0,02 75 0,052160 5.2160
0,01 75 0,061402 6.1402
Acest lucru este echivalent cu a spune, de exemplu, că:
  • Cutii verzi
vânzătorul riscă să fie respins de 3 ori din 100 ((1 - 0,97) x 100) un lot care conține 1 Salmonella la fiecare 2,5 kg (4,06 în 10000 g), în timp ce

.

.

.

  • Cutii galbene
este probabil ca cumpărătorul să accepte de 5 ori din 100 (0,05 x 100) un lot cu 1 Salmonella la fiecare 25 g (3.9943 în 100 g).

Creșterea cantității eșantionate (de exemplu 6 eșantioane de 25 g pentru un total de 150 g) ar fi mai puțin favorabilă vânzătorului, în timp ce ar oferi mai multe garanții cumpărătorului după cum urmează:

P (0) n p p%
P a 0,97 150 0,000203 0,0203 1 Salmonella la fiecare 5 kg
P c 0,05 150 0,019972 1.9972 1 Salmonella la fiecare 50 g

.

.

.

.

.

.

Verificați dacă există defecte în piese

Imaginați-vă că aveți de-a face cu o mulțime de obiecte care pot prezenta un defect acceptabil în anumite limite. Să presupunem că eșantionați un anumit număr (de ex. 300) pentru a fi supus inspecției pentru a decreta acceptabilitatea lotului pe baza unui anumit număr maxim de apariții sau a eșantioanelor care prezintă acel defect, care, deocamdată, este considerat variabil între zero și zece.

Cu Poisson construim următorul tabel cu valorile cumulative ale probabilității pentru numărul de apariții și defecte:

n 300 300 300 300 300 300 300 300 300 300 300
p% 0,0 0,5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
p 0,000 0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050
λ 0,00 1,50 3.00 4,50 6.00 7.50 9.00 10.50 12.00 13.50 Ora 15.00
k
0 1.0000 0,2231 0,0498 0,0111 0,0025 0,0006 0,0001 0,0000 0,0000 0,0000 0,0000
1 1.0000 0,5578 0.1991 0,0611 0,0174 0,0047 0,0012 0,0003 0,0001 0,0000 0,0000
2 1.0000 0,8088 0,4232 0,1736 0,0620 0,0203 0,0062 0,0018 0,0005 0,0001 0,0000
3 1.0000 0,9344 0,6472 0,3423 0,1512 0,0591 0,0212 0,0071 0,0023 0,0007 0,0002
4 1.0000 0,9814 0,8153 0,5321 0,2851 0,1321 0,0550 0,0211 0,0076 0,0026 0,0009
5 1.0000 0,9955 0,9161 0,7029 0,4457 0,2414 0,1157 0,0504 0,0203 0,0077 0,0028
6 1.0000 0,9991 0,9665 0,8311 0,6063 0,3782 0,2068 0,1016 0,0458 0,0193 0,0076
7 1.0000 0,9998 0,9881 0,9134 0,7440 0,5246 0,3239 0,1785 0,0895 0,0415 0,0180
8 1.0000 1.0000 0,9962 0,9597 0,8472 0,6620 0,4557 0,2794 0,1550 0,0790 0,0374
9 1.0000 1.0000 0,9989 0,9829 0,9161 0,7764 0,5874 0,3971 0,2424 0.1353 0,0699
10 1.0000 1.0000 0,9997 0,9933 0,9574 0,8622 0,7060 0,5207 0,3472 0,2112 0.1185

De exemplu, dacă s-ar decide acceptarea lotului conform criteriilor n = 300 și k = 4 , în aproximativ 2 cazuri din 100 (a se vedea caseta verde) un lot cu 0,5% din unitățile neconforme ar fi respins, în timp ce aproximativ 13 ori din 100 (vezi caseta galbenă) ar fi acceptat un lot cu 2,5% neconform.

Graficele rezultate din valorile de probabilitate văzute mai sus, referitoare la diferitele valori ale lui k pentru un număr dat de eșantioane (în acest exemplu n = 300 ), se numesc Curbe Operative , caracteristici pentru fiecare plan de eșantionare pe care vrem să îl presupunem .

Curbele de funcționare bazate pe n = 300 . În funcție de o serie de valori maxime k (eșantioane considerate neconforme), ele raportează probabilitatea de acceptare cu deficiența lotului

Controlul prin variabile

O distribuție de date „normală” (sau gaussiană) este caracterizată printr-o valoare așteptată corespunzătoare mediei aritmetice a datelor, printr-o simetrie absolută în jurul mediei (valoare centrală), prin forma caracteristică „clopot” a curbei care reprezintă funcția densității probabilității și, în cele din urmă, printr-un parametru foarte important legat de dispersia datelor în jurul valorii centrale, abaterea standard, care pentru Gaussian corespunde abaterii pătrate medii, adică

unde este
(media valorilor)

Calculul poate fi simplificat folosind formula echivalentă

unde este
(media pătratelor)

adică prin extragerea rădăcinii pătrate a diferenței dintre „media pătratelor” și „pătratul mediei”.

Aria de sub curba Gauss are o valoare de 1 deoarece, ca sumă a tuturor valorilor de probabilitate particulare, atinge 100%, adică certitudine. Există o relație precisă între această zonă și valoarea deviației standard, atât de mult încât este adesea evidențiat faptul că, în orice Gaussian, aproximativ 68% din date se încadrează între ( ) Și ( ), aproximativ 95% din ( ) Și ( ) și mai mult de 99% între ( ) Și ( ). Acestea sunt doar trei exemple folosite pentru a face raționamente aproximative, dar, pentru orice calcul particular, este posibil să se utilizeze „multiplicatorul deviației standard” ( z ) pentru a obține valoarea, în termeni de probabilitate, a unei anumite porțiuni din aria Gauss .

MULTIPLICATOR DE DEVIAȚIE STANDARD vs / zona sub curba normală la dreapta sau la stânga mediei
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0,0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0280 .0319 .0359
0,1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0754
0,2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0,3 .1179 .1217 .1255 .1294 .1331 .1368 .1406 .1443 .1480 .1517
0,4 .1555 .1591 .1628 .1665 .1700 .1736 .1772 .1808 .1844 .1879
0,5 .1914 1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0,6 .2258 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2518 .2549
0,7 .2580 .2612 .2642 .2674 .2704 .2734 .2764 .2794 .2823 .2852
0,8 .2881 .2910 .2939 .2967 .2996 .3023 .3051 .3079 .3106 .3133
0,9 .3159 .3186 .3213 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3486 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3666 .3686 .3708 .3729 .3749 .3770 .3791 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4050 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4223 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4331 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4430 .4441
1.6 .4452 .4464 .4474 .4485 .4496 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4595 .4599 .4609 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4700 .4706
1.9 .4713 .4719 .4726 .4733 .4738 .4744 .4751 .4756 .4762 .4767
2.0 .4773 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4831 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4862 .4865 .4868 .4871 .4873 .4878 .4881 .4884 .4888 .4890
2.3 .4893 .4895 .4898 .4902 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4919 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4944 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4957 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4977 .4977 .4977 .4978 .4979 .4980 .4980 .4981
2.9 .4981 .4982 .4983 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987

Înainte de a aborda definiția unui plan de eșantionare specific, este recomandabil să se studieze variabilitatea în produs a parametrului care urmează să fie controlat: acest lucru se realizează pur și simplu prin efectuarea de serii de analize pe un anumit număr de loturi și, în final, prin media abaterii standard valorile fiecărei serii (plus datele sunt repetitive, cu atât este mai mic numărul de repetări necesar). Aceasta este o fază preliminară care nu trebuie subestimată deoarece doar un număr bun de determinări permit valorilor experimentale (eșantion) neapărat aproximate să se apropie de valorile adevărate necunoscute (populația).

În al doilea rând, trebuie să ne concentrăm asupra scopului controlului, care poate fi

  • asigurați-vă că testul oferă adevărata valoare, cu excepția cazului în care eroarea este considerată acceptabilă cu o probabilitate prestabilită
  • asigurați-vă că, cu o anumită probabilitate, nu acceptați o mulțime cu valori mai mari sau mai mici decât o anumită limită (pentru moment, luați în considerare partea cumpărătorului)

În ambele cazuri, este vorba de a da o semnificație statistică valorii medii care va rezulta din controlul a n eșantioane: formula care ne permite să înfruntăm problema este

E = z σ / √n

unde σ / √n este abaterea standard a distribuției mijloacelor de n observații.

Am putea avea apoi două cazuri:

1) Dacă, în orice scop (de exemplu, plata bunurilor pe baza unui indice calitativ), se decide că valoarea experimentală nu trebuie să se abată de la valoarea reală cu o cantitate mai mare decât E cu o probabilitate P , valoarea va fi să se utilizeze z corespunzător lui P / 2 pentru a obține n = (z σ / E) . 100P ori din 100 valoarea reală va fi între Și .

Gaussian cu două cozi.png

2) Dacă, achiziționând un lot, doriți să aveți o probabilitate P de a-l accepta dacă valoarea unei anumite caracteristici nu este mai mică de , cu excepția cazului în care o eroare maximă egală cu E , valoarea lui z corespunzătoare lui P - 0,5 va fi utilizată pentru a obține n = (z σ / E) . 100P ori din 100 valoarea reală nu va fi mai mică de . Procedura este aceeași mișcare simetrică la dreapta mediei pentru cazurile de „nu mai mare de ...”.

Gaussian cu o coadă.png

Apoi, luând în considerare faptul că vânzătorul are 50 de șanse din 100 de a fi refuzat mult cu adevărata valoare egală cu , necesitatea posibilă de reducere a riscului vânzătorului trebuie confruntată cu referirea la o valoare centrală mai mică de limita de referință, adică la o valoare E mai mică (precizie mai mare), cu consecința faptului că trebuie să crești n conform ecuației de mai sus.

Elemente conexe