Validare încrucișată

Validarea încrucișată ( validare încrucișată în limba engleză ) este o tehnică statistică ^[1] utilizabilă în prezența unei numerozități bune a eșantionului observat . În special, așa - numita validare încrucișată k-fold constă în subdivizarea setului total de date în k părți de dimensiuni egale și, la fiecare pas, partea k ª a setului de date devine partea de validare, în timp ce restul partea constituie întotdeauna setul de instruire . În acest fel, modelul este instruit pentru fiecare dintre cele k părți, evitându-se astfel problemele de supra-montare , dar și de eșantionare asimetrică (și, prin urmare, afectată de distorsiuni ) a eșantionului observat , tipic subdiviziunii datelor în doar două părți ( adică instruire / validare). Cu alte cuvinte, eșantionul observat este împărțit în grupuri de dimensiuni egale, un grup la un moment dat este exclus iterativ și se încearcă predicția acestuia cu grupurile neexcluse, pentru a verifica bunătatea modelului de predicție utilizat.

Notă

^ Metoda de validare încrucișată

Bibliografie

I. Witten, E. Frank: Data Mining: Instrumente și tehnici practice de învățare automată , Morgan Kaufmann
R. Duda, P. Hart, D. Stork: Pattern Classification , Wiley
T. Hastie, R. Tibshirani, J. Friedman: Elementele învățării statistice , Springer

Elemente conexe

Alte proiecte

Wikimedia Commons conține imagini sau alte fișiere despre validare încrucișată

linkuri externe

( EN ) Tutorial de validare încrucișată de Andrew Moore, Universitatea Carnegie Mellon, SUA , la autonlab.org . Adus la 28 octombrie 2009 (arhivat din original la 16 aprilie 2010) .

Portal IT

Portalul de statistici

[1] Metoda de validare încrucișată

[1]