Corpus maro

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Corpusul standard al Universității Brown din engleza americană actuală (sau pur și simplu Brown Corpus ) este un corp compilat în anii 1960 de Henry Kucera și W. Nelson Francis de la Brown University , Providence (Rhode Island) . Conține 500 de fragmente de text în limba engleză din lucrări publicate în Statele Unite ale Americii în 1961, pentru un total de aproximativ un milion de cuvinte .

Distribuirea probelor de text

Corpusul este format din 500 de eșantioane publicate în 1961. Fiecare eșantion de text începe dintr-un punct ales aleatoriu al articolului sursă și continuă până la prima propoziție după primele 2000 de cuvinte. În foarte puține cazuri, unele mostre conțin mai puține cuvinte.

Introducerea inițială a datelor a fost făcută folosind aparate cu carduri perforate .

Cele 500 de eșantioane sunt distribuite aproximativ uniform între următoarele 15 categorii (și subcategoriile corespunzătoare, titlurile originale sunt raportate în limba engleză):

  • A. PRESĂ: Reportaj ( 44 de texte )
    • Politic
    • Sport
    • Societate
    • Știri Spot
    • Financiar
    • Cultural
  • B. PRESĂ: Editorial ( 27 de texte )
    • Cotidianul instituțional
    • Personal
    • Scrisori către editor
  • C. PRESĂ: Recenzii ( 17 texte )
    • teatru
    • cărți
    • muzică
    • dans
  • D. RELIGIE ( 17 texte )
    • Cărți
    • Periodice
    • Tracturi
  • E. ABILITĂȚI ȘI hobby-uri ( 36 de texte )
    • Cărți
    • Periodice
  • F. LORE POPULAR ( 48 de texte )
    • Cărți
    • Periodice
  • G. BELLES-LETTRES - Biografie, memorii etc. ( 75 de texte )
    • Cărți
    • Periodice
  • H. DIVERSE: Guvernul SUA și organele casei ( 30 de texte )
    • Documente guvernamentale
    • Rapoarte de fundație
    • Rapoarte de industrie
    • Catalogul colegiului
    • Orga House Industry
  • J. ÎNVĂȚAT ( 80 de texte )
    • Stiintele Naturii
    • Medicamente
    • Matematică
    • Științe sociale și comportamentale
    • Științe politice, drept, educație
    • Umaniste
    • Tehnologie și Inginerie
  • K. FICȚIE: General ( 29 versuri )
    • Romane
    • Povesti scurte
  • L. FICȚIE: Mister și ficțiune detectivă ( 24 de texte )
    • Romane
    • Povesti scurte
  • M. FICȚIE: Știință ( 6 texte )
    • Romane
    • Povesti scurte
  • N. FICȚIE: Adventure and Western ( 29 versuri )
    • Romane
    • Povesti scurte
  • P. FICȚIE: Poveste romantică și de dragoste ( 29 versuri )
    • Romane
    • Povesti scurte
  • R. UMOR ( 9 texte )
    • Romane
    • Eseuri etc.

Elemente conexe