Validare încrucișată

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Validarea încrucișată ( validare încrucișată în limba engleză ) este o tehnică statistică [1] utilizabilă în prezența unei numerozități bune a eșantionului observat . În special, așa - numita validare încrucișată k-fold constă în subdivizarea setului total de date în k părți de dimensiuni egale și, la fiecare pas, partea k ª a setului de date devine partea de validare, în timp ce restul partea constituie întotdeauna setul de instruire . În acest fel, modelul este instruit pentru fiecare dintre cele k părți, evitându-se astfel problemele de supra-montare , dar și de eșantionare asimetrică (și, prin urmare, afectată de distorsiuni ) a eșantionului observat , tipic subdiviziunii datelor în doar două părți ( adică instruire / validare). Cu alte cuvinte, eșantionul observat este împărțit în grupuri de dimensiuni egale, un grup la un moment dat este exclus iterativ și se încearcă predicția acestuia cu grupurile neexcluse, pentru a verifica bunătatea modelului de predicție utilizat.

Notă

Bibliografie

  • I. Witten, E. Frank: Data Mining: Instrumente și tehnici practice de învățare automată , Morgan Kaufmann
  • R. Duda, P. Hart, D. Stork: Pattern Classification , Wiley
  • T. Hastie, R. Tibshirani, J. Friedman: Elementele învățării statistice , Springer

Elemente conexe

Alte proiecte

linkuri externe