Validare încrucișată
Validarea încrucișată ( validare încrucișată în limba engleză ) este o tehnică statistică [1] utilizabilă în prezența unei numerozități bune a eșantionului observat . În special, așa - numita validare încrucișată k-fold constă în subdivizarea setului total de date în k părți de dimensiuni egale și, la fiecare pas, partea k ª a setului de date devine partea de validare, în timp ce restul partea constituie întotdeauna setul de instruire . În acest fel, modelul este instruit pentru fiecare dintre cele k părți, evitându-se astfel problemele de supra-montare , dar și de eșantionare asimetrică (și, prin urmare, afectată de distorsiuni ) a eșantionului observat , tipic subdiviziunii datelor în doar două părți ( adică instruire / validare). Cu alte cuvinte, eșantionul observat este împărțit în grupuri de dimensiuni egale, un grup la un moment dat este exclus iterativ și se încearcă predicția acestuia cu grupurile neexcluse, pentru a verifica bunătatea modelului de predicție utilizat.
Notă
Bibliografie
- I. Witten, E. Frank: Data Mining: Instrumente și tehnici practice de învățare automată , Morgan Kaufmann
- R. Duda, P. Hart, D. Stork: Pattern Classification , Wiley
- T. Hastie, R. Tibshirani, J. Friedman: Elementele învățării statistice , Springer
Elemente conexe
Alte proiecte
- Wikimedia Commons conține imagini sau alte fișiere despre validare încrucișată
linkuri externe
- ( EN ) Tutorial de validare încrucișată de Andrew Moore, Universitatea Carnegie Mellon, SUA , la autonlab.org . Adus la 28 octombrie 2009 (arhivat din original la 16 aprilie 2010) .