Definiție
În teoria probabilității, timpul mediu de ieșire al unui șir este calculul ieșirii așteptate a unui șir prefixat de {\ displaystyle k} caractere prin extragerea aleatorie a literelor dintr-un set finit de caractere, date de formulă {\ displaystyle \ mathbf {E} [U] = \ sum _ {h \ in H} m ^ {h}} , unde este:
- {\ displaystyle m} este numărul total de caractere ale alfabetului de referință
- {\ displaystyle H} este un set de indici care conține valorile
- poziția primului personaj, egală cu {\ displaystyle {\ text {1}}}
- poziția ultimului caracter, egală cu lungimea {\ displaystyle k} a șirului
- pozițiile fiecărui sub-șir repetat în cadrul șirului
- {\ displaystyle U} este o variabilă aleatorie care definește timpul de ieșire al șirului
Pentru a calcula predicția, este necesar, de asemenea, să cunoaștem probabilitatea ca un personaj să iasă din setul total de caractere, dată de {\ displaystyle P \ {X_ {n} = i \}} , unde este {\ displaystyle X_ {n}} este o variabilă aleatorie care poate asuma valorile unui caracter al alfabetului, în timp ce evenimentul {\ displaystyle \ {X_ {n} = i \}} definește ieșirea personajului {\ displaystyle i} la {\ displaystyle n} -a extragere.
Exemplu
Prognoza timpului mediu de ieșire al cuvântului ABRACADABRA este calculată folosind alfabetul englezesc format din douăzeci și șase de litere.
Folosind definiția avem asta {\ displaystyle {\ begin {cases} m = 26 \\ k = 11 \\ H = \ {1,4,11 \} \\ P \ {X_ {n} = i \} = {\ frac {1} {26}} \ end {cases}}}
Este notat ca {\ displaystyle H} conține pozițiile primului și ultimului personaj, precum și poziția ultimului caracter al șirului ABRA repetat.
Din aceasta rezultă că {\ displaystyle \ mathbf {E} [U] = 26 ^ {1} + 26 ^ {4} + 26 ^ {11} \ simeq 3,67 \ times 10 ^ {15}} , adică timpul mediu de ieșire al cuvântului ABRACADABRA este după ce a efectuat aprox {\ displaystyle 3670} miliarde de apăsări aleatorii pe o tastatură de {\ displaystyle 26} personaje.
Trecând la limită
Se poate vedea cu ușurință că prezicerea timpului mediu de ieșire al unui șir este o funcție divergentă pe măsură ce crește numărul de caractere de extras. Prin urmare, limita predicției pentru un număr de caractere care tind spre infinit este infinitul, adică {\ displaystyle \ lim _ {k \ rightarrow \ infty} (\ sum _ {h \ in H} m ^ {h}) = \ infty, \ forall {m> 1}} .
Limita poate fi calculată intuitiv, având în vedere ipoteza că nu există sub-șiruri repetate. Dacă această limită tinde spre infinit , cu atât mai mult limita în cazul repetărilor tinde spre infinit. Este posibil să nu se țină cont de indicele inițial, care este întotdeauna egal cu unul, deoarece ar fi o constantă în calculul limitei . Pe baza acestor considerații se observă că {\ displaystyle m ^ {k} \ leqslant \ sum _ {h \ in H} m ^ {h}, \ forall {m> 1}} iar dacă limita de {\ displaystyle m ^ {k}} pentru {\ displaystyle k} care tinde spre infinit este egal cu infinitul , apoi și limita {\ displaystyle \ sum _ {h \ in H} m ^ {h}} va fi egal cu infinitul . Pentru fiecare {\ displaystyle m> 1 \ in \ mathbb {N}} funcția {\ displaystyle m ^ {k}} deci este divergent {\ displaystyle \ lim _ {k \ rightarrow \ infty} m ^ {k} = \ infty} .
Afirmație
Este {\ displaystyle C = \ {1,2, \ ldots, m \}} un set de {\ displaystyle m} personaje, cu {\ displaystyle m \ in \ mathbb {N} \ smallsetminus \ {0 \}} . Puteți defini un șir prefixat {\ displaystyle (a_ {j}) _ {1 \ leqslant j \ leqslant k}} de lungime {\ displaystyle k} personaje astfel încât {\ displaystyle a_ {j} \ în C, \ forall {j = 1, \ ldots, k}} .
Este {\ displaystyle (\ Omega, {\ mathcal {A}}, P)} un spațiu de probabilitate , astfel încât {\ displaystyle \ Omega = \ {1, \ ldots, m \}} , {\ displaystyle {\ mathcal {A}}} e o {\ displaystyle \ sigma} - algebra de {\ displaystyle \ Omega} Și {\ displaystyle P} o măsură a probabilității pe spațiu{\ displaystyle (\ Omega, {\ mathcal {A}})} . Pe acest spațiu se poate construi o succesiune de variabile aleatorii {\ displaystyle (X_ {n}) _ {n> 0}} astfel încât {\ displaystyle P \ {X_ {n} = i \} = {\ frac {1} {m}} = p, \ forall {n> 0, i \ în C}} .
Este {\ displaystyle T = \ inf \ {n: X_ {n + j} = a_ {j}, \ forall {j = 1, \ ldots, k} \}} cel mai mic timp în care timp {\ displaystyle n + j + k} succesiunea {\ displaystyle (X_ {n}) _ {n}} faceți șirul {\ displaystyle (a_ {j}) _ {j}} . Se definește pe sine {\ displaystyle U = T + k} timpul de ieșire al șirului.
Dovedește că {\ displaystyle \ mathbf {E} [U] = \ sum _ {h \ in H} m ^ {h}} , cu {\ displaystyle H = \ {h: 1 \ leqslant h \ leqslant k, a_ {k-h + j} = a_ {j}, \ forall {j = 1, \ ldots, k} \}} .
Demonstrație
Este{\ displaystyle F = (F_ {n}) _ {n}} o filtrare astfel încât {\ displaystyle F_ {0} = \ {\ varnothing, \ Omega \}} Și {\ displaystyle F_ {n} = \ sigma (X_ {1}, X_ {2}, \ ldots, X_ {n})} , și anume {\ displaystyle \ sigma} -algebra generată de succesiunea variabilelor aleatorii în timp {\ displaystyle n} .
Observația 1
{\ displaystyle T} Și {\ displaystyle U} sunt momente de oprire în ceea ce privește {\ displaystyle F}
Pentru paradoxul Borel {\ displaystyle P \ {X_ {n + 1} = a_ {1}, X_ {n + 2} = a_ {2}, \ ldots, X_ {n + k} = a_ {k} \} = 1} , aceasta este probabilitatea de a obține secvența {\ displaystyle (a_ {j}) _ {j}} tastarea aleatorie a literelor pe o tastatură este aproape sigură . Din aceasta rezultă că {\ displaystyle P \ {T <\ infty \} = 1} . De asemenea {\ displaystyle U} este un timp de oprire în ceea ce privește {\ displaystyle F} în asta, a fi {\ displaystyle k} o constantă , {\ displaystyle P \ {T + k <\ infty \} = P \ {U <\ infty \} = 1}
Observația 2
{\ displaystyle P \ {T + k> n \} = \ sum _ {h \ in H} {\ Bigl (} \ prod _ {j = 1} ^ {h} {\ frac {1} {p}} {\ Bigr)} P \ {T + k = n + h \}}
Pentru fiecare se definește o succesiune de variabile aleatoare independente {\ displaystyle n} fix, {\ displaystyle (Y_ {j} ^ {(n)}) _ {j> 0}} astfel încât {\ displaystyle Y_ {j} ^ {(n)} = {\ frac {1} {p}} \ mathrm {I} _ {\ {X_ {n + j} = a_ {j} \}}, \ forall {j = 1, \ ldots, k}} . Succesiunea este independentă , deoarece este o funcție a succesiunii {\ displaystyle (X_ {n}) _ {n}} , de asemenea, independent .
Pentru fiecare {\ displaystyle j} se observă că prognoza de {\ displaystyle Y_ {j} ^ {(n)}} este egal cu unul. Intr-adevar {\ displaystyle \ mathbf {E} [Y_ {j} ^ {(n)}] = {\ frac {1} {p}} p = 1}
Se ridică {\ displaystyle M_ {j} ^ {(n)} = {\ begin {cases} 1 {\ text {se}} 0 \ leqslant j \ leqslant n \\\ prod _ {j = 1} ^ {h} Y_ {j} ^ {(n)} {\ text {se}} j = n + h, {\ text {con}} 1 \ leqslant h \ leqslant k \\ M_ {n + k} ^ {(n)} {\ text {se}} j> n + h \ end {cases}}}
Succesiunea {\ displaystyle (M_ {j} ^ {(n)}) _ {j}} e o {\ displaystyle F} - martingale .
Observația 2.1
{\ displaystyle T = \ inf \ {n: M_ {n + k} ^ {(n)} \ neq 0 \}}
Observația 2.2
{\ displaystyle \ mathrm {I} _ {\ {T> n \}} M_ {n + k} ^ {(n)} = 0}
Se ridică {\ displaystyle L ^ {(n)} = M ^ {(n) | U} = (M_ {U \ land j}) _ {j}} , care pentru transformarea conform Burkholder este, de asemenea, una {\ displaystyle F} - martingale .
Găsiți valoarea lui{\ displaystyle L_ {n + k} ^ {(n)}} cand {\ displaystyle T> n} .
{\ displaystyle \ mathrm {I} _ {\ {T> n \}} L_ {n + k} ^ {(n)} = \ mathrm {I} _ {\ {T> n \}} M_ {U \ land n + k} ^ {(n)} = \ mathrm {I} _ {\ {T> n \}} M_ {T + k \ land n + k} ^ {(n)}}
Din moment ce analizăm cazul că {\ displaystyle T> n} , cel mai mic dintre {\ displaystyle T + k} Și {\ displaystyle n + k} este exact {\ displaystyle n + k}
{\ displaystyle \ mathrm {I} _ {\ {T> n \}} M_ {T + k \ land n + k} ^ {(n)} = \ mathrm {I} _ {\ {T> n \} } M_ {n + k} ^ {(n)} = \ mathrm {I} _ {\ {T> n \}} \ prod _ {j = 1} ^ {k} Y_ {j} = \ mathrm {I } _ {\ {T> n \}} \ prod _ {j = 1} ^ {k} {\ frac {1} {p}} \ mathrm {I} _ {\ {X_ {j} = a_ {j } \}}}
Prin definiția lui {\ displaystyle T} , care este cel mai mic {\ displaystyle n} astfel încât șirul să fie realizat, avem {\ displaystyle M_ {n + k} ^ {(n)} = 0} deoarece există cel puțin un personaj {\ displaystyle j} între {\ displaystyle 1} Și {\ displaystyle k} unde este {\ displaystyle X_ {j} \ neq a_ {j}} . Consecința este că {\ displaystyle \ mathrm {I} _ {\ {X_ {n + j} = a_ {j} \}} = 0} prin urmare {\ displaystyle \ mathrm {I} _ {\ {T> n \}} \ prod _ {j = 1} ^ {k} {\ frac {1} {p}} \ mathrm {I} _ {\ {X_ {j} = a_ {j} \}} = 0}
Observație 2.3
{\ displaystyle \ mathrm {I} _ {\ {T + k = n + h \}} M_ {n + h} ^ {(n)} = {\ begin {cases} \ mathrm {I} _ {\ { T + k = n + h \}} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h}, {\ text {se}} h \ în H \\ 0 { \ text {se}} h \ not \ în H \ end {cases}}}
Găsiți valoarea lui{\ displaystyle M_ {n + h} ^ {(n)}} cand {\ displaystyle T + k = n + h} .
{\ displaystyle \ mathrm {I} _ {\ {T + k = n + h \}} M_ {n + h} ^ {(n)} = \ mathrm {I} _ {\ {T + k = n + h \}} \ prod _ {j = 1} ^ {h} Y_ {j} ^ {(n)}}
{\ displaystyle \ mathrm {I} _ {\ {T + k = n + h \}} \ prod _ {j = 1} ^ {h} Y_ {j} ^ {(n)} = \ mathrm {I} _ {\ {T + k = n + h \}} \ prod _ {j = 1} ^ {h} {\ frac {1} {p}} \ mathrm {I} _ {\ {X_ {n + j } = a_ {j} \}}}
{\ displaystyle \ mathrm {I} _ {\ {T + k = n + h \}} \ prod _ {j = 1} ^ {h} {\ frac {1} {p}} \ mathrm {I} _ {\ {X_ {n + j} = a_ {j} \}} = \ mathrm {I} _ {\ {T + k = n + h \}} \ prod _ {j = 1} ^ {h} { \ frac {1} {p}} \ mathrm {I} _ {\ {X_ {T + kh + j} = a_ {j} \}}}
Rezultă că
{\ displaystyle \ mathrm {I} _ {\ {T + k = n + h \}} M_ {n + h} ^ {(n)} = {\ begin {cases} \ mathrm {I} _ {\ { T + k = n + h \}} \ prod _ {j = 1} ^ {h} {\ frac {1} {p}} = \ mathrm {I} _ {\ {T + k = n + h \ }} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h}, {\ text {se}} h \ in H \\ 0 {\ text {se}} h \ not \ in H \ end {cases}}}
Pe baza observației 2.3 avem asta {\ displaystyle \ mathrm {I} _ {\ {T + k> n \}} M_ {n} ^ {(n)} = \ sum _ {h \ in H} \ mathrm {I} _ {\ {T + k = n + h \}} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h}}
Având în vedere că{\ displaystyle M_ {n} ^ {(n)} = 1} prin definiție avem că {\ displaystyle P \ {\ mathrm {I} _ {\ {T + k> n \}} 1 \} = P \ {{\ begin {matrix} \ sum _ {h \ in H} \ mathrm {I} _ {\ {T + k = n + h \}} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} \ end {matrix}} \}}
Deoarece probabilitatea unei funcții indicator corespunde evenimentului în sine, avem asta {\ displaystyle P \ {T + k> n \} = \ sum _ {h \ în H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} P \ { T + k = n + h \}}
Concluzie
{\ displaystyle \ mathbf {E} [U] = \ sum _ {n} P \ {U> n \} = \ sum _ {n} P \ {T + k> n \}}
Pentru observația 2 avem asta {\ displaystyle \ sum _ {n} P \ {T + k> n \} = \ sum _ {n} \ sum _ {h \ în H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} P \ {T + k = n + h \}}
Privind fix {\ displaystyle h} și făcându-l să varieze {\ displaystyle n} obții asta {\ displaystyle \ sum _ {n} \ sum _ {h \ în H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} P \ {T + k = n + h \} = \ sum _ {h \ în H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} \ sum _ {n} P \ {T + k = n + h \}}
Suma pentru fiecare {\ displaystyle n} a probabilității ca timpul de oprire {\ displaystyle T} este egal cu {\ displaystyle n + hk} este echivalent cu calcularea probabilității ca {\ displaystyle T} este finit, egal cu {\ displaystyle 1} pentru observare 1 .
Prin urmare, teza este dovedită prin obținerea acelui {\ displaystyle \ mathbf {E} [U] = \ sum _ {h \ in H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h} \ sum _ {n } P \ {T + k = n + h \} = \ sum _ {h \ în H} {\ Bigl (} {\ frac {1} {p}} {\ Bigr)} ^ {h}}
Verificări experimentale
Timpul mediu de ieșire al unui șir poate fi demonstrat experimental prin implementarea unui algoritm care simulează extracția aleatorie a caracterelor și eșantionarea numărului de extracții necesare pentru a compune un cuvânt dat. Algoritmul poate fi implementat printr-un simulator sau utilizând un limbaj de programare furnizat cu o bibliotecă care implementează un generator de numere pseudo-aleatorii . Următorul descrie un exemplu simplu de algoritm , scris în limbajul ANSI C , care vă permite să testați timpii de ieșire ai unui șir. Apoi descriem modul în care datele sunt eșantionate și se arată că datele tind spre predicție matematică .
Algoritm de eșantionare
Pentru a eșantiona timpul de ieșire al unui șir este necesar să implementați un algoritm care efectuează aceeași extracție de un anumit număr de ori, de obicei mai mare de treizeci. Alfabetul de referință este cel englezesc format din douăzeci și șase de litere.
#include <stdio.h>
#include <stdlib.h>
#include <limits.h>
#include <string.h>
#include <time.h>
#define MIN_CAR 97
#define MAX_CAR 122
#define DELTA_CAR 26
#define MARKER_STR "-s"
#define MARKER_LAPS "-n"
#define MARKER_SID "-r"
#define MARKER_SAVE "-f"
#define MARKER_VERBOSE "-v"
#define VERBOSE_OFF "off"
int verbose ;
nesemnat lung lung extract_string ( int l , char * s ) {
nesemnat lung lung n ;
int k , maxk ;
char c ;
n = 0 ;
k = 0 ;
maxk = 0 ;
while ( k < l ) {
if ( n == ULLONG_MAX ) {
if ( verbose == 1 ) {
printf ( "limita maximă de extracție atinsă:% llu \ n " , n );
printf ( "numărul maxim de caractere extrase:% d din% d \ n " , maxk , l );
fflush ( stdout );
}
retur 0 ;
}
c = ( char ) ( MIN_CAR + ( rand () % DELTA_CAR ));
if ( c == s [ k ]) {
k ++ ;
if ( maxk < k ) {
maxk = k ;
}
} altceva {
k = 0 ;
}
n ++ ;
}
if ( verbose == 1 ) {
printf ( "șir extras după% llu pas \ n " , n );
fflush ( stdout );
}
retur n ;
}
int main ( int argc , char * argv []) {
int i , l = -1 , n = -1 ;
timp_t t ;
unsigned int sid = 0 ;
retras lung lung nesemnat ;
char * s ;
FIȘIER * f = NUL ;
detaliat = 1 ;
pentru ( i = 0 ; i < argc ; i ++ ) {
if ( strcmp ( argv [ i ], MARKER_STR ) == 0 ) {
s = argv [ i + 1 ];
l = strlen ( s );
} else if ( strcmp ( argv [ i ], MARKER_GIRI ) == 0 ) {
n = atoi ( argv [ i + 1 ]);
} else if ( strcmp ( argv [ i ], MARKER_SID ) == 0 ) {
sid = atoi ( argv [ i + 1 ]);
} else if ( strcmp ( argv [ i ], MARKER_VERBOSE ) == 0 ) {
if ( strcmp ( argv [ i + 1 ], VERBOSE_OFF ) == 0 ) {
detaliat = 0 ;
}
} else if ( strcmp ( argv [ i ], MARKER_SAVE ) == 0 ) {
f = fopen ( argv [ i + 1 ], "a" );
if ( f == NULL ) {
printf ( "eroare la crearea fișierului \ n " );
fflush ( stdout );
retur -1 ;
}
}
}
if ( l == -1 ) {
if ( verbose == 1 ) {
printf ( "specificați șirul de extras: -s [șir] \ n " );
fflush ( stdout );
}
retur -1 ;
}
if ( n == -1 ) {
if ( verbose == 1 ) {
printf ( "specificați numărul de iterații: -n [numărul de iterații] \ n " );
fflush ( stdout );
}
retur -1 ;
}
if ( sid == 0 ) {
if ( verbose == 1 ) {
printf ( "nu este specificat niciun side (opțiunea -r [sid]), utilizați sid generat automat \ n " );
fflush ( stdout );
}
sid = ( unsigned int ) time ( & t );
}
if ( verbose == 1 ) {
printf ( "**** începe extracția **** \ n " );
printf ( "sid =% du \ n " , sid );
printf ( "șir =% s \ n " , s );
printf ( "lungime =% d \ n " , l );
printf ( "iterații =% d \ n \ n " , n );
fflush ( stdout );
}
srand ( sid );
pentru ( i = 0 ; i < n ; i ++ ) {
ret = extract_string ( l , s );
if ( ret == 0 ) {
printf ( "eroare la extragerea șirului \ n " );
fflush ( stdout );
retur -1 ;
}
if ( f ! = NULL ) {
fprintf ( f , "% llu \ n " , ret );
}
}
if ( f ! = NULL ) {
fclose ( f );
}
retur 0 ;
}
Pentru a compila codul, este necesar să îl salvați într-un fișier (de exemplu, gen.c) și să creați executabilul printr-un compilator C. Mai jos este comanda pentru a compila sursa cu compilatorul gcc pentru sistemul de operare Linux .
Testarea ipotezei prin testul lui Student
Testul de ipoteză al studentului vă permite să determinați dacă media eșantionului {\ displaystyle {\ bar {x}}} se abate semnificativ de la media matematică {\ displaystyle \ mathbf {E} [U]} . Ipoteze sunt formulate pentru a efectua testul {\ displaystyle H_ {0}: {\ bar {x}} = E [U]} Și {\ displaystyle H_ {1}: {\ bar {x}} \ neq E [U]} . În cazul în care se testează ipoteza {\ displaystyle H_ {0}} se stabilește că cele două prognoze sunt relevante cu o anumită probabilitate de eroare. În cazul în care se testează ipoteza {\ displaystyle H_ {1}} se stabilește că cele două prognoze nu sunt relevante cu o anumită probabilitate de eroare. Pentru efectuarea testului de verificare este necesar să se obțină următoarele date:
- {\ displaystyle n \ in \ mathbb {N _ {+}}} este dimensiunea eșantionului, adică de câte ori a fost înregistrat timpul de ieșire al cuvântului „salut”
- {\ displaystyle (x_ {1}, x_ {2}, \ ldots, x_ {n}) \ in \ mathbb {N} ^ {n}} este eșantionul care trebuie verificat, unde {\ displaystyle \ forall {i = 1, \ ldots, n}, x_ {i}} reprezintă numărul de extracții care au avut loc înainte de a compune cuvântul „salut”
- {\ displaystyle {\ bar {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} {x_ {i}}} este media eșantionului
- {\ displaystyle {\ bar {\ sigma}} ^ {2} = {\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar { x}}) ^ {2}} este varianța eșantionului
- {\ displaystyle \ mathbf {E} [U] = \ sum _ {h \ in H} m ^ {h}} este media matematică
- {\ displaystyle Z = {\ frac {({\ bar {x}} - \ mathbf {E [U]})} {\ sqrt {\ sigma ^ {2}}}} {\ sqrt {n}}} este statistica cu care are legea Studentului {\ displaystyle (n-1)} grade de libertate
- {\ displaystyle \ alpha \ in \ mathbb {R}, {\ text {tc}} 0 <\ alpha <1} este eroarea tolerabilă în confirmarea ipotezei
- {\ displaystyle q _ {(n-1, \ alpha)} \ in \ mathbb {R _ {+}}} este cuantila legii lui Student cu {\ displaystyle (n-1)} grade de libertate asociate toleranței {\ displaystyle \ alpha}
Testul se efectuează prin compararea valorii statistice cu cuantila relativă. În cazul în care {\ displaystyle Z <q _ {(n-1, \ alpha)}} apare ipoteza {\ displaystyle H_ {0}} cu o probabilitate egală cu {\ displaystyle 1- \ alpha} . În cazul în care, pe de altă parte, {\ displaystyle Z \ geq q _ {(n-1, \ alpha)}} ipoteza este respinsă {\ displaystyle H_ {0}} iar ipoteza este confirmată {\ displaystyle H_ {1}} cu o probabilitate de eroare egală cu {\ displaystyle \ alpha} .
Exemplu
Trecem la un exemplu concret de verificare a ipotezelor prin intermediul testului Student {\ displaystyle H_ {0}} Și {\ displaystyle H_ {1}} .
În primul rând, datele sunt eșantionate folosind algoritmul descris în secțiunea anterioară cu comanda
./gen -s hello -n 100 -f sampling -r 1492875030
unde este:
- salut este șirul de extras
- 100 este numărul de probe
- eșantionarea este numele fișierului în care vor fi salvate rezultatele extragerilor
- 1492875030 este sămânța pentru inițializarea generatorului pseudo-aleator
De îndată ce programul termină execuția, este posibil să continuați cu testul Student pentru a stabili dacă numărul de extracții necesare pentru a obține șirul „salut” este relevant pentru predicția matematică . Se calculează parametrii necesari pentru a efectua testul:
- {\ displaystyle n = 100} este dimensiunea eșantionului
- {\ displaystyle {\ bar {x}} = 493329.65} este media eșantionului
- {\ displaystyle {\ bar {\ sigma}} ^ {2} = 253288754254,291} este varianța eșantionului
- {\ displaystyle \ mathbf {E [U]} = 456976} este media matematică
- {\ displaystyle Z = 0.7224} este statistica cu legea Studentului
- apare {\ displaystyle \ alpha = 0,05} ca eroare tolerabilă în cazul verificării {\ displaystyle H_ {1}}
- cuantila asociată este {\ displaystyle q _ {(n-1, \ alpha)} = 1.660}
Fiind {\ displaystyle Z <q _ {(n-1, \ alpha)}} ipoteza este confirmată {\ displaystyle H_ {0}} și, prin urmare, media eșantion confirmă media matematică. Analizând graficul de mai jos cu tendința prognozelor parțiale pe măsură ce numărul variază, este clar cum {\ displaystyle {\ bar {x}} {\ xrightarrow [{n \ rightarrow \ infty}] {}} \ mathbf {E [U]}} .