Istoria statisticilor
Acest articol sau secțiune referitoare la matematică este considerat a fi verificat . |
Statistica este o știință relativ tânără al cărei conținut nu este încă vizibil corect, deoarece este adesea confundat cu statistici : date, tabele, grafice, indici, medii. De fapt, este prezent în toate științele și reprezintă un instrument esențial pentru descoperirea legilor și a relațiilor dintre fenomene. Prin intervenția în toate situațiile în care este necesar să se ia decizii în condiții de incertitudine, statisticile sunt configurate ca un moment important în cercetarea științifică, planificarea economică și acțiunea politică.
Evoluția istorică a statisticii ascunde două suflete care se regăsesc atât în predare și cercetare, cât și în gândirea comună a nespecialiștilor și, prin urmare, în limba mass-media .
Etimologie
Etimologia cuvântului „statistici” derivă din cuvântul italian „stat” și se referă, în aproape toate limbile europene, la observația că primele informații despre fenomenele reale au fost colectate și organizate de către organele statului care au fost, de asemenea, principalii utilizatori. Există și alte versiuni despre derivarea etimologică a „Statisticii”, precum cea care se referă la statut , pentru a indica faptul că această știință examinează situația contingentă a realității sau la statera latină (= echilibru), la Stadt-ul german (= oraș ). Deși convingătoare la nivel logic-conceptual, aceste derivări nu găsesc dovezi istorice obiective în comparație cu utilizarea în creștere a termenului „Statistică” destinat ca o colecție de informații organizată și gestionată de „stat”. Prima apariție a cuvântului „statistici” în acest sens pare a fi cea a italianului Girolamo Ghilini care, între 1666 și 1668 , a publicat Ristretto della civil, politica, statistica și știința militară [1] .
Statistica ca o colecție de date
Primul suflet al statisticilor este inerent homo sapiens care devin conștienți de lume și de colegii săi și care, în lupta pentru supraviețuire, dezvoltă comportamente optime de hrănire, apărare și reproducere. Aceste strategii alternează înfrângeri și succese, dar, datorită aproximărilor succesive, permit difuzarea credințelor, obiceiurilor și obiceiurilor și, în cele din urmă, a cunoașterii, științei și culturii. Când aceste convingeri sunt codificate în viața clanului, a tribului, a unui popor sau a unei națiuni, se nasc regulile de comportament și, prin urmare, legea. Această nevoie cognitivă crește odată cu dezvoltarea relațiilor dintre popoare.
Odată cu nașterea marilor state europene, un interes public este atribuit analizei statistice a fenomenelor colective care împinge progresiv națiunile occidentale să se doteze cu institutele statistice „centrale”, desemnate prin lege pentru colectarea, organizarea și diseminarea datelor privind asupra locuințelor, asupra resurselor economice și asupra tuturor aspectelor relevante ale vieții colective a unei națiuni, a unei Comunități de state ( Uniunea Europeană ) sau a întregii planete ( Națiunile Unite ).
Astăzi, organismele publice care colectează și diseminează în mod instituțional informații statistice sunt nenumărate și acționează în conformitate cu o ierarhie de competențe care identifică autoritatea locală ca locație principală pentru colectarea datelor elementare, în timp ce verificarea, agregarea și publicarea sunt responsabilitatea organismului central. (pentru Italia este ISTAT ).
Formalizarea matematică a statisticii
Al doilea suflet al Statisticii apare dintr-o observație diferită care a fost complet formalizată doar în câteva secole. În fața schimbării realității, există rezultate care merită mai multă încredere decât altele, deoarece sunt repetate mai regulat. Acest lucru este perceput mai ales în legătură cu clima și alternanța anotimpurilor, dar se referă și la culturile agricole, bolile, afacerile umane etc. În astfel de contexte, mintea umană înregistrează regularități fără certitudini, credințe nu foarte sigure, repetări de evenimente nu întotdeauna garantate de un rezultat unic. Pe de o parte, aceasta generează frică și impune prudență împotriva riscurilor (mai întâi reciprocitate și apoi asigurare), pe de altă parte solicită jocul și pariul (inventând artificial incertitudinea rezultatului prin instrumente simple: mingi, zaruri, cărți).
Deși a fost bine prezentă în istorie și cultură încă din zorii civilizației, probabilitatea devine un concept important și bine formalizat numai din secolul al XVIII-lea chiar dacă, anterior și mulțumită mai ales lui Galileo , Pascal și Fermat , este posibil să întrezări apariția unui nou mod de a aplica matematica la jocuri, adică noua disciplină care va fi numită ulterior Calculul probabilităților . Cu toate acestea, va trebui să așteptăm încă două sute de ani pentru ca legătura dintre observațiile incerte și posibilitatea de a le prevedea, controla și simula să devină clară. Astfel, la începutul secolului al XX-lea, s-a născut și se răspândește o abordare a studiului realității, care își găsește nucleul central în inferență și în schemele probabilistice ale instrumentelor utile și esențiale pentru luarea deciziilor coerente.
Fuziunea dintre aceste două suflete ale statisticii are loc foarte târziu și numai atunci când, în fața naturii tot mai experimentale a cunoașterii, apare problema validității ipotezelor.
Metoda statistică devine de fapt metodologia cercetării științifice și practica în analiza rezultatelor de laborator chiar înainte de a fi recunoscută ca instrument independent de cercetare.
Astăzi, de asemenea, ca o consecință a schimbărilor tehnologice și informatice rapide, asistăm la o încercare constantă de a utiliza statistici pentru a susține teze predefinite, adică ca instrument de persuasiune ideologică.
Cronologie
1400-1499
- 1494 : Luca Pacioli formulează în cartea sa Summa de arithmetica, geometria, proportioni et proportionalita întrebarea cunoscută sub numele de problema punctelor (sau părților ), rezolvată un secol și jumătate mai târziu, în 1654 , de Pascal și de Fermat . Erorile soluției sale au fost identificate aproape jumătate de secol mai târziu, în 1539 , de Girolamo Cardano .
1500-1599
- 1539 : Girolamo Cardano demonstrează argumentul eronat al lui Pacioli în problema punctelor
- 1564 : Girolamo Cardano scrie Liber de ludo aleae , un ghid practic pentru jucători, care conține câteva considerații teoretice fundamentale. Această carte a fost publicată postum în 1663 .
1600-1699
- 1613 - 1623 : Galileo Galilei scrie eseul Deasupra descoperirilor zarurilor
- 1654 : într-un schimb de scrisori între Blaise Pascal și Pierre de Fermat bazele teoriei probabilității moderne sunt puse prin analiza așa-numitei probleme punctuale
- 1657 : Christiaan Huygens publică De ratiociniis de ludo aleae , prima carte despre teoria probabilității, reînviată și comentată de Jakob Bernoulli în Ars conjectandi (publicată postum în 1713).
- 1663 : publicarea postumă a Liber de ludo aleae a lui Girolamo Cardano
1700-1799
- 1708 : Pierre de Montmort scrie Essai d'analyse sur le jeux de hasard („Eseu de analiză asupra jocurilor de noroc”).
- 1709 : Nikolaus Bernoulli publică De usu artis conjectandi in jure , abordând, printre altele, problema speranței de viață
- 1713 : Ars conjectandi de Jakob Bernoulli este publicat postum unde, printre altele , este formulată prima teoremă a limitei, sau legea numărului mare .
- 1760 : Un matematician elvețian, Johann Heinrich Lambert , folosește grafice de înaltă calitate în lucrarea sa Fotometrie .
- 1764 : Eseu către rezolvarea unei probleme în Doctrina șanselor , în care Thomas Bayes formulează teorema fundamentală a lui Bayes, este publicat postum
- 1782 : August Friedrich Wilhelm Crome , economist german, folosește ceea ce sunt acum numite cartograme în Producten-Karte von Europa .
- 1786 : William Playfair folosește zeci de diagrame (mai ales serii cronologice, dar și primul grafic cu bare ) în Atlasul său comercial și politic .
1800-1899
- 1801 : William Playfair introduce graficul circular în Statistical Breviary („Statistic Breviary”).
- 1824 :Variabila aleatorie Cauchy este studiată de Siméon-Denis Poisson cu douăzeci de ani înainte de Augustin-Louis Cauchy . Ca parte a criticilor asupravariabilei aleatoare normale, Poisson arată că aritmetica medie a n erori independente distribuite cu funcția de densitate în cauză nu tinde spre o normală.
- 1834 : la propunerea lui Lambert-Adolphe-Jacques Quételet se înființează Societatea de Statistică din Londra .
- 1835 : Lambert-Adolphe-Jacques Quételet publică o lucrare în care, printre altele, existau date referitoare la mărimea pieptului soldaților scoțieni și la statura recruților francezi. Quételet a arătat cum aceste date s-au distribuit ca o variabilă normală aleatorie, dar nu au mers mai departe.
- 1853 : la propunerea lui Lambert-Adolphe-Jacques Quételet se ține primul congres al Institutului Internațional de Statistică (înainte de înființare).
- 1854 : medicul britanic John Snow reușește să ia măsuri de igienă publică, salvând sute de vieți de holeră , datorită unuia dintre primele studii epidemiologice, deși această abordare era inovatoare și neobișnuită pentru acele vremuri.
- 1879 : Luigi Perozzo introduce o stereogramă reprezentând piramida tridimensională a populației pornind de la datele recensământului suedez 1750-1875.
- 1885 : se înființează Institutul Internațional de Statistică .
1900-1919
- 1900
- Karl Pearson prezintă variabila aleatorie chi pătrat .
- George Udny Yule publică articolul Despre asocierea atributelor în statistici în Tranzacțiile filozofice ale Societății Regale din Londra, unde introduce indexul de asociere pentru tabelele de contingență 2x2 numit Yule's Q.
- 1901
- Biometrika , o revistă britanică, este fondată la inițiativa lui Karl Pearson , WFRWeldon și Charles Davenport . Finanțatorii săi includ Francis Galton , printre editorii săi Karl Pearson însuși.
- 1903
- George Udny Yule descrie Paradoxul Simpson în articolul Note despre teoria asocierii atributelor în statistici , care a apărut în Biometrika, cu jumătate de secol înainte ca Edward Hugh Simpson să o facă cu articolul Interpretarea interacțiunii în tabelele de contingență din Journal of the Royal Statistical Society ( 1951 ).
- 1904
- Karl Pearson introduce termenul tabel de contingență .
- Charles Spearman pune bazele analizei factoriale , pe care le va finaliza opt ani mai târziu.
- Charles Spearman propune coeficientul de corelație a rangului .
- 1908
- William Sealy Gosset prezintă variabila aleatorie t a Studentului și testul corespunzător.
1920-1949
- 1925
- Ronald Fisher publică remarcabilele metode statistice pentru cercetătorii care vor influența generații de cercetători. Analiza varianței apare în acest text.
- Ronald Fisher introduce conceptul de grade de libertate .
- În timpul congresului Institutului Internațional de Statistică , după ani de controverse, o rezoluție adoptată face distincție între eșantionarea aleatorie și eșantionarea motivată .
- 1926
- George Udny Yule abordează în De ce primim niște corelații fără sens între seriile temporale? Un studiu în eșantionare și seria timpului , problema corelației false .
- 1933
- Andrey Nikolaevich Kolmogorov publică axiomele probabilității în Grundbegriffe der Wahrscheinlichkeitsrechnung .
- Andrey Nikolaevich Kolmogorov descrie statistica | Fn (x) - F0 (x) |.
- Harold Hotelling fondează analiza componentelor principale publicând „Analiza unui complex de variabile statistice în componente principale”.
- Jerzy Neyman și Egon Pearson publică Despre problema celor mai eficiente teste ale ipotezelor statistice unde este descrisă abordarea „Neyman-Pearson” dezvoltată încă din 1926 .
- În cadrul congresului Institutului Internațional de Statistică , la inițiativa lui K.Wikler, se înființează o comisie pentru standardizarea reprezentărilor grafice în statistici .
- 1935
- Ronald Fisher introduce în The Design of Experiments regula conform căreia experimentele trebuie programate (proiectate) înainte de a fi efectuate, pentru ca testele statistice să fie valabile. În acest context a introdus conceptele de ipoteză nulă (H 0 ) și ipoteză experimentală (H 1 ). El afirmă (și aceasta este o mare noutate în domeniul metodei științifice) că nici o cercetare experimentală nu ar putea dovedi ipoteza experimentală, ci doar „accepta” sau „respinge” ipoteza nulă, chiar dacă efectuează multe experimente în care ipoteza a crescut credibilitatea că ipoteza experimentală este adevărată.
- 12 septembrie: Harold Hotelling tratează subiectul „Relații între două seturi de variate” (publicat în 1936 în Biometrika ) în Ann Arbor înaintea Societății Americane de Matematică și a Institutului de Statistică Matematică, fondând astfel metoda multivariată cunoscută sub numele de analiză de corelație canonică . În același an publică „Cel mai previzibil criteriu”, care pune, de asemenea, bazele acestei metode.
- Alexander Craig Aitken cu Pe cele mai mici pătrate și combinații liniare de observații introduce notația matricială pentru modelul de regresie liniară și estimatorul pentru cele mai mici pătrate generalizate în cazul matricei de covarianță de eroare non-standard
- 1936
- George Gallup atinge o notorietate mare prin prezicerea corectă a rezultatului alegerilor prezidențiale prin intervievarea a doar 50.000 de oameni, în timp ce Literatur Digest, de atunci foarte apreciat, a ratat în mod flagrant predicția, în ciuda interviului multor oameni.
- 1938
- fizicianul Frank Benford a analizat colecții de numere prin formularea legii lui Benford deja descoperită în 1881 de matematicianul și astronomul Simon Newcomb și descrisă în „American Journal of Mathematics”.
- 1939
- Vladimir Smirnov construiește testul Kolmogorov-Smirnov .
- Societatea italiană de statistică a fost fondată pe 15 ianuarie 1939.
- Robert Tryon introduce termenul de analiză cluster
- 1942
- Alexander Craig Aitken și Harold Silverstone publică Despre estimarea parametrilor statistici în care ideile în curs de dezvoltare ale lui Ronald Fisher derivă un caz particular al ceea ce este acum cunoscut sub numele de inegalitate Cramér-Rao
- 1948
- Sunt publicate rezultatele unei cercetări privind utilizarea streptomicinei pentru tratamentul tuberculozei, care a folosit primul studiu clinic randomizat, proiectat de Austin Bradford Hill .
- 1949
- George Kingsley Zipf (1902-1950), lingvist și filolog american, după ce a studiat frecvența cu care apar cuvintele pentru mai multe limbi, propune în „Comportamentul uman și principiul minimului efort” o relație cunoscută acum sub numele de legea lui Zipf .
Din 1950
- 1960 - Sidney Siegel și John Wilder Tukey publică testul Siegel-Tukey în Jurnalul Asociației Statistice Americane cu articolul „O sumă nonparametrică a procedurilor de rang pentru răspândirea relativă în eșantioane nepereche”.
- 1975 (10 iunie) - Se înființează Societatea Bernoulli pentru statistici și probabilități matematice .
- 1979 - Bradley Efron publică „Metode Bootstrap: o altă privire asupra cuțitului” în The Annals of Statistics , fondând metoda bootstrap în statistici
Notă
Bibliografie
- Scrisoarea lui Pascal , de Keith Devlin, ed. Italiană. 2008 (titlu original: Jocul neterminat , 2008)
- Originile gândirii statistice moderne (1820-1900) , de Thedore M. Porter, ediția italiană 1993 (titlu original: Rise of Statistical Thinking. 1820-1900 , 1986)
- Triumful numerelor. Cum au modelat calculele vieții moderne , de Bernahrd I. Cohen, ed. Italiană 2007 (titlu original: Triumful numerelor. Cum au modelat viața modernă , 2005)
- Histoire de la statistique , de Jean-Jacques Droesbeke și Philippe Tassi, 1990
- Epoca de aur a graficelor statistice , de Michael Friendly, Statistical Science, 2008, vol. 23, nr. 4, 502-535 - pdf
Elemente conexe
Alte proiecte
- Wikimedia Commons conține imagini sau alte fișiere despre istoricul statisticilor