Analiza continutului

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Analiza conținutului este un set mare și eterogen de tehnici manuale sau asistate de computer pentru interpretarea contextualizată a documentelor provenite din procesele de comunicare în sensul adecvat (texte) sau semnificație (urme și artefacte), cu obiectivul final de a produce inferențe valide și fiabile[1] .

Termenul de „analiză a conținutului” este controversat din punct de vedere istoric și încă astăzi este asociat cu un set destul de mare și eterogen de definiții, metode, practici și instrumente " [2] . La un nivel ridicat de generalizare, analiza conținutului (din analiza conținutului în limba engleză) este o familie de tehnici aparținând domeniului științelor sociale orientată spre studiul conținutului acelor tipuri de documentație empirică pe care, cu Hodder, le putem defini „documente tăcute” ( dovezi mut ), adică texte și artefacte [3] . în mod specific, luând în considerare cele mai recente evoluții din literatura de referință, documentația empirică supusă în mod obișnuit controlului cu analiza conținutului provine fie din procesele de comunicare strictiore sensu (adică procesele în care există un emitent care activează procesul de comunicare și un cod care este suficient împărțit între expeditor și destinatar ) sau prin procese care, în semiotică , sunt de obicei numite di s aprindere (absența emitentului și a unui cod comun, semioza se dezvoltă prin răpire ) [4] [5] . În conformitate cu cele spuse, textele (scrise, audiovizuale, iconice, multimedia etc.) pot fi definite în mod corespunzător ca documente care provin din procesele de comunicare în sens strict; cele care derivă din procesele de semnificație sunt împărțite în urme și artefacte [6] .

Începând cu anii nouăzeci, difuzarea în creștere a software-ului pentru analiza textului a dat o accelerare considerabilă utilizării documentelor în cercetarea socială (utilizată și în alte domenii decât cele ale comunicațiilor de masă ), determinând creșterea exponențială a aplicațiilor și soluțiilor.

Pregătirea textului și a programelor pentru analiza conținutului

Odată definit setul de texte care urmează a fi analizat, este necesar să avem grijă de organizarea și transcrierea lor internă, acordând o atenție deosebită următoarelor cerințe:

a) comparabilitatea textelor;

b) disponibilitatea uneia sau mai multor caracteristici care trebuie asociate fiecărui fragment (de exemplu, genul sau vârsta autorului sau data sau capul unui articol de ziar);

c) dimensiunea textului: este necesar să existe texte suficient de lungi (cel puțin 20.000 de cuvinte sau apariții) care să facă avantajoasă utilizarea tehnicilor de analiză automată.

Programele pentru analiza conținutului pot fi împărțite în două grupe:

a) software de tip CAQDAS (software de analiză calitativă a datelor asistat de computer) care vă permite să etichetați manual porțiuni de text cu coduri alfanumerice referitoare la conceptele pe care cercetătorii doresc să le evidențieze (cele mai cunoscute sunt Etnograful, NUD.IST, Atlas și Nvivo);

b) software care vizează analiza semiautomatică utilizând tehnici statistice și lexicale (cele mai cunoscute sunt SPAD, Sphinx, Alceste, Lexico, Wordmapper, Taltac și Tlab).

Software-ul primului grup este foarte util pentru navigarea textului, dar pe măsură ce crește dimensiunea textelor de analizat, munca de codificare devine foarte costisitoare. Software-ul celui de-al doilea grup, pe de altă parte, se bazează pe analiza cuvintelor și a relațiilor lor în cadrul textului și sunt deosebit de potrivite pentru analiza sistematică a textelor mari.

Operațiuni de analiză

În general, punctul de plecare este analiza diferitelor cuvinte care alcătuiesc corpusul , ordonate prin scăderea valorilor frecvenței ( vocabular ). Dintre cuvintele de înaltă frecvență ale unui vocabular, pe lângă cele cu conținut instrumental (de și, care, pentru etc.), care nu sunt foarte informative și sunt în general prezente în toate textele, se întâlnește imediat așa-numitul „ cuvinte tematice ", care, tocmai datorită frecvenței lor ridicate, fac posibilă înțelegerea imediată a principalelor subiecte ale textului.

Pașii de analiză care vă permit să descrieți semi-automat conținutul unui text sunt următorii:

  1. analiza segmentelor repetate;
  2. analiza coincidenței;
  3. analiza caracteristică a cuvintelor;
  4. analiza limbajului particular;
  5. analiza cuvintelor cu caracteristici gramaticale omogene;
  6. analiza concordanței;
  7. analiza corespondențelor lexicale.

Segmentele repetate sunt acele forme compuse, formate din cuvinte care apar în corpus cu aceeași succesiune. Unele dintre ele sunt deosebit de relevante din punct de vedere semantic, deoarece permit delimitarea semnificațiilor cuvintelor prezente în text (de exemplu: card de credit, șef de stat, politică economică, poliție financiară). Setul de segmente repetate semnificative ale unui text ajută la furnizarea unei reprezentări sintetice a conținutului corpusului și la identificarea rapidă a actorilor, obiectelor și acțiunilor pe care este structurat textul.

Analiza coincidențelor vă permite să studiați asocierile dintre cuvinte, identificând acele cuvinte care apar cel mai adesea apropiate unele de altele.

Analiza cuvintelor caracteristice (sau specifice) face posibilă diferențierea diferitelor părți ale unui text prin evidențierea acelor cuvinte care sunt supra-reprezentate în limba unei categorii de autori (de exemplu femei, articole dintr-un anumit ziar etc.) ). În acest fel este posibil să se caracterizeze limbajul, sau mai simplu referințele tematice supra-reprezentate în anumite grupuri de indivizi.

Pentru analiza limbajului particular este necesar să existe o resursă lingvistică particulară, lexiconele de frecvență, construite în general pentru a reprezenta limba comună a unei comunități lingvistice date. În aceste liste alcătuite din milioane de apariții și derivate din surse diferite (scris, limbă vorbită, literatură etc.), fiecare cuvânt este asociat cu o frecvență, care servește la indicarea utilizării așteptate a fiecărui cuvânt în comunitatea lingvistică la care lexicul este înrudit. Prin compararea vocabularului textului în cauză cu cel al lexiconului de frecvență ales, este posibil să se obțină o listă de cuvinte supra-reprezentate care corespund limbajului specific al textului în sine.

Chiar și setul de cuvinte cu caracteristici gramaticale omogene poate fi util pentru analiză: de exemplu setul de verbe legate de lemă poate oferi un clasament al acțiunilor menționate în text, setul de adjective oferă elemente pentru a evalua tonul unei text sau setul și tipul pronumelor pot explica tipul de interacțiune prezentă între subiecții care caracterizează textul.

Pentru a reveni la textul original, este foarte utilă analiza concordanțelor (Cuvânt cheie în context), o tehnică care vă permite să analizați contextul de utilizare a unui cuvânt de interes (sau grupuri de cuvinte cu aceeași rădăcină) afișând n cuvinte care preced și n care urmează cuvântului analizat, de fiecare dată când apare în corpus . Analiza concordanțelor este indispensabilă atât pentru rezolvarea unor ambiguități semantice, cât și pentru reconstituirea referințelor tematice la care se referă pentru fiecare cuvânt, trasând o hartă conceptuală între cuvinte și teme abordate.

Analiza corespondențelor lexicale este o tehnică multivariată care permite sintetizarea informațiilor conținute într-o matrice mare de date textuale, vizualizând la nivel factorial asocierea dintre formele (cuvintele) din textul analizat, căutând cea mai bună reprezentare simultană a elementele rândului și coloanei, pentru a studia interdependența dintre caractere. Axele pot fi interpretate ca dimensiuni semantice prin care să se citească corpusul : apropierea dintre cuvinte la nivel factorial se referă la combinarea sau asocierea lor în text, iar explorarea asocierilor dintre cuvinte contribuie la citirea / descrierea corpusului .

Notă

  1. ^ G Tipaldo, Analiza conținutului și mass-media. Obiecte, metode și instrumente , Bologna, Il Mulino, 2014, p. 42, ISBN 978-88-15-24832-9 .
  2. ^ G Tipaldo, Analiza conținutului și mass-media. Obiecte, metode și instrumente , Bologna, Il Mulino, 2014, p. 31, ISBN 978-88-15-24832-9 .
  3. ^ I. Hodder, Interpretarea documentelor și a culturii materiale , Thousand Oaks etc., Sage, 1994, p. 155, ISBN 0-7619-2687-9 .
  4. ^ G. Tipaldo, Santangelo A., Manual de evaluare a calității TV , Preston, Marea Britanie, Editura UCLan, 2013, p. 29, ISBN 978-0-9926349-1-9 .
  5. ^ G. Tipaldo, Analiza conținutului și mass-media , Bologna, IT, Il Mulino, 2014, pp. 29-30, ISBN 978-88-15-24832-9 (arhivat dinoriginal la 26 februarie 2014) .
  6. ^ G Tipaldo, Analiza conținutului și mass-media. Obiecte, metode și instrumente , Bologna, Il Mulino, 2014, pp. 25-30, ISBN 978-88-15-24832-9 .

Bibliografie

  • Bolasco Sergio, Analiza datelor multidimensionale. Metode, strategii și criterii de interpretare , 1999, Roma, Carocci, (6 ^ reeditare, 2014), ISBN 88-430-1401-3 .
  • Bolasco Sergio, Analiza automată a textelor. Cercetarea cu extragerea textului , 2013, Roma, Carocci, ISBN 978-88-430-7018-3 .
  • Della Ratta-Rinaldi Francesca, Interpretarea sistematică a materialului care derivă din focus grupuri prin analiza textuală , în „Sociologie și cercetare socială”, 2005, XXVI (76-77), pp. 91-104.
  • Jenny Jacques, Méthodes et pratiques formalisées d'analyse de contents și de discours dans la recherche sociologique française contemporaine. Etat des lieux et essai de classification , în „Bulletin de Méthodologie Sociologique”, 1997, 54, pp. 64-112.
  • Krippendorff Klaus, Analiza conținutului. Introducere metodologică, 1983, Torino: ERI.
  • Losito Gianni, Analiza conținutului în cercetarea socială , 2007, Milano, Franco Angeli.
  • Giuliano Luca, La Rocca Gevisa, Analiza automată și semi-automată a datelor textuale, 2008, Milano, Ediții Universitare LED, ISBN 978-88-7916-382-8
  • Lebart Ludovic, Salem André, Analyze statistique des données textuelles. Question ouverte et lexicométrie , 1988, Paris, Dunod, ISBN 2-10-002239-3 .
  • Nobile Stefano, Credibilitatea analizei de conținut , 1997, Milano, Franco Angeli, ISBN : 9788846403070
  • Santangelo Antonio și Tipaldo Giuseppe, „Handbook of TV Quality Assessment: A socio-semiotic approach for Prix Italia jurors”, 2013, Editura UCLan, Preston, Marea Britanie, ISBN 978-0-9926349-1-9 .
  • Silverman David, How to do qualitative research , 2002, Roma, Carocci, ISBN 88-430-2139-7 .
  • Tipaldo Giuseppe, Analiza conținutului și a mass-media. Obiecte, metode și instrumente ", 2014, Bologna, Il Mulino, ISBN 978-88-15-24832-9 .
  • Tuzzi Arjuna, Analiza conținutului. Introducere în metode și tehnici de cercetare , 2003, Roma, Carocci.

Elemente conexe

linkuri externe

Controlul autorității Tesauro BNCF 48824 · LCCN (EN) sh85031537 · BNF (FR) cb11940319x (dată) · NDL (EN, JA) 00.576.822