Analiza sentimentelor

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Analiza sentimentelor

Analiza sentimentului sau analiza sentimentului (cunoscută și sub denumirea de minerit de opinie) este un domeniu al „ procesării limbajului natural care se ocupă de construirea sistemelor pentru identificarea și extragerea opiniilor din text. Se bazează pe principalele metode de lingvistică computațională și analiză textuală . Analiza sentimentelor este utilizată în multe sectoare: de la politică la piețele de valori, de la marketing la comunicare, de la sport la științe medicale și naturale, de la analiza social media la evaluarea preferințelor consumatorilor.

Metode și caracteristici

Abordările existente ale analizei sentimentelor pot fi grupate în 4 categorii principale [1] :

  • identificarea cuvintelor cheie;
  • afinitate lexicală;
  • metode statistice;
  • tehnici de nivel conceptual.

Primul clasifică textul după categorii influente pe baza prezenței unor cuvinte influente fără echivoc, cum ar fi fericit, trist, frică, plictisit [2] . Afinitatea lexicală nu numai că detectează cuvintele care influențează, dar atribuie în mod arbitrar cuvintelor o afinitate probabilă pentru anumite emoții [3] . Metodele statistice, pe de altă parte, se bazează pe elemente preluate din învățarea automată, cum ar fi analiza semantică latentă, mașinile vectoriale de sprijin , punga de cuvinte și orientarea semantică [4] . Pentru a extrapola opinia într-un context și pentru a obține caracteristicile sale, se utilizează relații gramaticale ale cuvintelor. Relațiile sunt obținute dintr-o analiză sintactică profundă a textului [5] . Spre deosebire de tehnicile pur sintactice, abordările la nivel conceptual influențează elementele reprezentării cunoașterii, cum ar fi ontologiile și rețelele semantice, și, prin urmare, sunt capabile să detecteze semantica care este subtil exprimată [6] .

Analiza sentimentelor și Web 2.0

Resurse de analiză a sentimentelor

Vocabulare și cuvinte despre sentiment:

Analizoare de sentimente:

  • AlchemyAPI [15] (comercial);
  • BitextAPI [16] (comercial);
  • Semantria [17] (comercială);
  • Sentiment140 [18] (comercial, pentru Twitter);
  • Stanford NLP [19] (academic);
  • Twinword [20] (comercial, gratuit / nelimitat);
  • Werfamous [21] (gratuit);
  • WordStat [22] (comercial);
  • Buzzlogix [23] (versiuni gratuite și comerciale).

Documentele adnotate manual, care pot fi utilizate pentru evaluarea algoritmilor):

  • Set de date Twitter în 4 limbi [24] (12.500 de tweets).

Notă

  1. ^ Erik Cambria, Björn Schuller, Yunqing Xia și Catherine Havasi, New Avenues in Opinion Mining and Sentiment Analysis , în IEEE Intelligent Systems , vol. 28, nr. 2, 2013, pp. 15–21, DOI : 10.1109 / MIS.2013.30 .
  2. ^ Andrew Ortony, G Clore și A Collins, The Cognitive Structure of Emotions ( PDF ), Cambridge Univ. Press, 1988 (arhivat din original la 23 noiembrie 2015) .
  3. ^ Ryan Stevenson, Joseph Mikels și Thomas James, Caracterizarea normelor afective pentru cuvintele în limba engleză după categorii emoționale discrete ( PDF ), în Behavior Research Methods , vol. 39, nr. 4, 2007, pp. 1020-1024. Adus pe 7 februarie 2016 (arhivat din original la 4 martie 2016) .
  4. ^ Peter Turney, Thumbs Up sau Thumbs Down? Orientare semantică aplicată clasificării nesupravegheate a recenziilor , în Proceedings of the Association for Computational Linguistics , 2002, pp. 417-424, arXiv : vezi LG / 0212032 .
  5. ^ Lipika Dey și SK Mirajul Haque, Opinion Mining from Noisy Text Data , în Proceedings of the second workshop on Analytics for nostructured text text data, p.83-90 , 2008.
  6. ^ Erik Cambria și Amir Hussain, Sentic Computing: Tehnici, instrumente și aplicații ( PDF ), Springer, 2012.
  7. ^ generarea setului de date Norme afective pentru cuvinte în limba engleză (ANEW) , la tomlee.wtf .
  8. ^ Ryan A. Stevenson, Joseph A. Mikels și Thomas W. James,Caracterizarea normelor afective pentru cuvintele în limba engleză prin categorii emoționale discrete , în Behavior Research Methods , vol. 39, nr. 4, 1 noiembrie 2007, pp. 1020–1024, DOI : 10.3758 / BF03192999 , ISSN 1554-351X ( WC ACNP ) .
  9. ^ a b SenticNet , pe sentic.net .
  10. ^ Erik Cambria, Daniel Olsher și Dheeraj Rajagopal, SenticNet 3: O bază de cunoștințe comună și de bun simț pentru analiza sentimentului bazată pe cunoaștere ( PDF ), în Proceedings of AAAI , 2014, pp. 1515–1521.
  11. ^ Stefano Baccianella, Andrea Esuli și Fabrizio Sebastiani, Sentiwordnet 3.0: O resursă lexicală îmbunătățită pentru analiza sentimentelor și extragerea opiniei ( PDF ), în Proceedings of LREC , 2010, pp. 2200-2204. Adus pe 5 aprilie 2014 .
  12. ^ SentiWordNet , pe cnr.it.
  13. ^ Carlo Strapparava și Alessandro Valitutti, WordNet-Affect: O extindere afectivă a WordNet ( PDF ), în Proceedings of LREC , 2004, pp. 1083-1086 (arhivat din original la 3 martie 2016) .
  14. ^ Manuela Speranza, FBK, WordNet Domains , pe fbk.eu.
  15. ^ Copie arhivată , pe alchemyapi.com . Adus la 7 februarie 2016 (arhivat din original la 21 septembrie 2009) .
  16. ^https://www.bitext.com/
  17. ^ Semantria Web Demo - semantria.com , pe semantria.com .
  18. ^ API - Sentiment140 - Un instrument de analiză a sentimentelor Twitter , la sentiment140.com .
  19. ^ Modele profunde recursive pentru compoziționalitatea semantică peste o bancă de arbori de sentimente , despre Deeply Moving: Deep Learning for Sentiment Analysis .
  20. ^ Demonstrare web Twinword Sentiment Analysis API , la twinword.com .
  21. ^ Un instrument de analiză a sentimentelor Twitter și web , la werfamous.com . Adus la 31 ianuarie 2021 (Arhivat din original la 14 august 2018) .
  22. ^ Software de analiză a conținutului pentru analiza sentimentelor , la provalisresearch.com .
  23. ^ (EN) API de analiză a textului și analiză a sentimentelor | Buzzlogix , pe Buzzlogix | API de analiză a textului , Buzzlogix.com. Adus la 23 noiembrie 2015 (arhivat din original la 25 noiembrie 2015) .
  24. ^ DAI-Labor> Centre de competență> CC IRML> Seturi de date> Set de date despre sentimente adnotate , pe dai-labor.de . Adus la 7 februarie 2016 (arhivat din original la 29 februarie 2016) .

Alte proiecte

linkuri externe