Set de date Iris

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Setul de date Iris este un set de date multivariat introdus de Ronald Fisher în 1936. Este format din 150 de cazuri de Iris măsurate de Edgar Anderson și clasificate în funcție de trei specii : Iris setosa , Iris virginica și Iris versicolor . Cele patru variabile luate în considerare sunt lungimea și lățimea sepalului și petalei . Datorită erorilor, există mai multe versiuni ale setului de date utilizate în literatura științifică. [1]

Setul de date Iris este utilizat în învățarea automată ca exemplu de clasificare statistică . [2] [3]

Notă

  1. ^ (EN) Bezdek, JC, Keller, JM; Krishnapuram, R.; Kuncheva, LI; Pal, NR, Datele reale ale irisului se vor ridica? , în IEEE Transactions on Fuzzy Systems , vol. 7, nr. 3, IEEE, 1999, pp. 368-369, DOI : 10.1109 / 91.771092 , ISSN 1063-6706 ( WC ACNP ) .
  2. ^ (EN) O introducere în învățarea automată cu scikit-learn , pe scikit-learn.
  3. ^ (EN) Yanchang Zhao, R și Data Mining: Exemple și studii de caz (PDF), 26 aprilie 2013.

Bibliografie

linkuri externe

  • ( EN ) Iris Data Set , pe UC Irvine Machine Learning Repository .