Glotocronologie

Glotocronologia (din greaca veche: γλῶττα = limbă și χρóνος = timp , adică cronologia limbilor) este partea din lexicostatistică care studiază relațiile dintre limbi și divergența sau evoluția lor în timp. ^[1]

Ideea a fost dezvoltată de lingvistul american Morris Swadesh (1909-1967) pe baza a două ipoteze:

există un vocabular de bază relativ stabil (care astăzi se numește lista Swadesh ) în toate limbile lumii
substituirea cuvintelor are loc într-un mod similar cu decăderea radioactivă , cu o viteză constantă în timp, astfel încât aproximativ 14% din lexiconul de bază al unei limbi este înlocuit la fiecare o mie de ani.

Lista inițială a lui Swadesh a avut o extindere considerabilă de-a lungul timpului, dar contribuția sa inițială este atât de stabilită încât glotocronologia este de fapt asociată cu numele său. ^[1] ^[2]

Glotocronologie Swadesh

Presupuneri de baza

Metoda glotocronologică se bazează pe două postulate explicite formulate de lingvistul american Morris Swadesh :

Rata de înlocuire lexicală este aproximativ constantă dacă luăm în considerare perioade foarte lungi, cel puțin în ceea ce privește lexiconul de bază.
Rata de înlocuire lexicală, cel puțin pentru vocabularul de bază, este aproximativ uniformă în toate limbile lumii.

Formularea matematică a acestor două postulate este exprimată prin următoarele ecuații:

Dacă m ( t ) este procentul cuvintelor de bază reținute de o limbă după o perioadă t (în unități de timp), primul postulat poate fi scris în următoarea formă:

{\frac {dm(t)}{dt}}=-{\frac {m(t)}{C}}

{\ displaystyle {\ frac {dm (t)} {dt}} = - {\ frac {m (t)} {C}}}

{\ displaystyle {\ frac {dm (t)} {dt}} = - {\ frac {m (t)} {C}}}

Unde C este o constantă omogenă cu t (adică în aceeași unitate ca t).

Soluția acestei ecuații diferențiale este:

m(t)=e^{-{\frac {t}{C}}}

{\ displaystyle m (t) = e ^ {- {\ frac {t} {C}}}}

{\ displaystyle m (t) = e ^ {- {\ frac {t} {C}}}}

Al doilea postulat implică faptul că C trebuie să fie o constantă universală, valabilă pentru toate limbile umane. Urmând ideea lui Swadesh de o rată de modificare de 14% pe mileniu pentru vocabularul de bază, ajungem la următoarea estimare pentru C :

C=-{\frac {t}{\ln(m(t))}}=-{\frac {t}{\ln((1-{\frac {14}{100}})^{({\frac {t}{1000\mathrm {anni} }})})}}=-{\frac {1000\mathrm {anni} }{\ln(1-{\frac {14}{100}})}}

{\ displaystyle C = - {\ frac {t} {\ ln (m (t))}} = - {\ frac {t} {\ ln ((1 - {\ frac {14} {100}}) ^ {({\ frac {t} {1000 \ mathrm {years}}})}}}} = - {\ frac {1000 \ mathrm {years}} {\ ln (1 - {\ frac {14} {100} })}}}

{\ displaystyle C = - {\ frac {t} {\ ln (m (t))}} = - {\ frac {t} {\ ln ((1 - {\ frac {14} {100}}) ^ {({\ frac {t} {1000 \ mathrm {years}}})}}}} = - {\ frac {1000 \ mathrm {years}} {\ ln (1 - {\ frac {14} {100} })}}}

C\approx 6630\mathrm {anni}

{\ displaystyle C \ approx 6630 \ mathrm {years}}

{\ displaystyle C \ approx 6630 \ mathrm {years}}

Din această estimare, timpul de separare T _s poate fi estimat prin compararea procentului de cuvinte conexe reținute p _C :

T_{s}={\frac {\log(p_{C})}{\log(p_{0})}}

{\ displaystyle T_ {s} = {\ frac {\ log (p_ {C})} {\ log (p_ {0})}}}

{\ displaystyle T_ {s} = {\ frac {\ log (p_ {C})} {\ log (p_ {0})}}}

între o limbă și limba maternă, e

T_{s}\approx {\frac {\log(p_{C})}{2\cdot \log(p_{0})}}

{\ displaystyle T_ {s} \ approx {\ frac {\ log (p_ {C})} {2 \ cdot \ log (p_ {0})}}}

{\ displaystyle T_ {s} \ approx {\ frac {\ log (p_ {C})} {2 \ cdot \ log (p_ {0})}}}

între două limbi care au o limbă maternă comună, unde p ₀ = 0,86 (= 86%) este procentul de reținere pe mileniu estimat de Swadesh.

Robert Lees a ajustat ulterior valoarea medie, estimând-o la 80,5% pe mileniu.

Metoda a fost comparată cu datarea cu carbon-14 utilizată în arheologie. Datorită acestuia este practic posibil să se calculeze data aproximativă când două sau mai multe limbi conexe ar fi format un nucleu comun. Cele două proceduri au similitudini, dar cu o diferență notabilă: degradarea carbonului-14 este întotdeauna constantă și nu depinde de condițiile externe.

Calibrare

Distribuția probabilității în funcție de numărul de cuvinte înrudite din lista Swadesh reținută într-un mileniu, presupunând că toate cuvintele din listă au aceeași rată de reținere, că este constantă în timp și egală cu p = 0,86. Valoarea așteptată pentru numărul de cuvinte înrudite este 86 (această valoare exactă este obținută în 11,4% din cazuri), dar există o probabilitate diferită de zero de a obține o valoare ușor diferită în cazul real.

Morris Swadesh a estimat că rata de înlocuire din lista de vocabular de bază de 100 de termeni a fost de aproximativ 14%, deci rata de reținere este de p ₀ = 0,86 (= 86%). Robert Lees a modificat ulterior valoarea medie, calculând-o la 80,5% pe mileniu. Alți lingviști au estimat rate de păstrare de 92-95%, eliminând cuvintele împrumutate și concentrându-se exclusiv pe înlocuirea maternă în limbă.

Se poate arăta că lista este alcătuită din termeni de stabilitate diferită (rata individuală de substituție), deci rata de schimb nu poate fi constantă, dar scade în funcție de faptul că cuvintele mai volatile sau instabile sunt înlocuite; prin urmare, proporția cuvintelor stabile reținute crește proporțional cu numărul de cuvinte reținute. Acest fapt a fost analizat în câteva modificări ulterioare ale glotocronologiei.

Fluctuațiile statistice pot fi, de asemenea, importante, deoarece numărul de cuvinte înrudite păstrate urmează o distribuție polinomială precum:

P_{k}={\begin{pmatrix}100\\k\end{pmatrix}}p^{k}(1-p)^{100-k}

{\ displaystyle P_ {k} = {\ begin {pmatrix} 100 \\ k \ end {pmatrix}} p ^ {k} (1-p) ^ {100-k}}

{\ displaystyle P_ {k} = {\ begin {pmatrix} 100 \\ k \ end {pmatrix}} p ^ {k} (1-p) ^ {100-k}}

Pentru diferite valori ale ratei de retenție, se poate observa că valoarea așteptată a timpului de separare se abate de la valoarea teoretică:

Autor	Rata de retentie $p\,$ ${\ displaystyle p \,}$ ${\ displaystyle p \,}$	Rata de schimbare $1-p\,$ ${\ displaystyle 1-p \,}$ ${\ displaystyle 1-p \,}$	Timpul de separare (teoretic)	Timpul de separare (mediu) $\mu \,$ ${\ displaystyle \ mu \,}$ ${\ displaystyle \ mu \,}$	Timpul de separare (apreciat) $\sigma \,$ ${\ displaystyle \ sigma \,}$ $\ sigma \,$
M. Swadesh	0,86	0,14	1000 ani	1005 ani	8.51 ani
R. Lees	0,805	0,195	1000 ani	1006 ani	7.22 ani
	0,93	0,07	1000 ani	1005 ani	12.0 ani

Critici

Metoda glotocronologică a făcut obiectul a numeroase critici. Lingvistul Eugen Coșeriu din 1962 a furnizat câteva date preluate din limbile romanice care arată că utilizarea acestuia ar putea duce la inexactități semnificative. Principalele obiecții pe care le-a întâmpinat sunt următoarele:

Constanta de retenție nu este universală, ea variază în funcție de timp, mediu, limbă și semnificația cuvântului;
Modelul arborelui genealogic ( Stammbaummodel ) pare prea confuz atunci când este aplicat câmpului lingvistic. Influența dintre limbi continuă adesea după separarea lor, în timp ce teoria glotocronologică consideră că odată ce separarea a avut loc, nu mai există interacțiune;
Transformări fonetice pot împiedica identificarea a două cuvinte înrudite ( de exemplu , bucătar - șef în franceză și capul în limba engleză) sau conduc la reconcilieri incorecte ( de exemplu , între ziua engleză și spaniolă Día);
Unele limbi au sinonime multiple pentru unii termeni de vocabular de bază. El a răspuns prin propunerea de a alege cel mai comun cuvânt.
O pereche de cuvinte poate fi parțial legată, cum ar fi sol în spaniolă și soleil în franceză. În aceste cazuri s-a propus să le considerăm cuvinte complet corelate sau să le atribuim coeficienți.
În unele limbi, vocabularul de bază conține cuvinte împrumutate ; în aceste cazuri cuvântul nu trebuie luat în considerare.
În unele limbi, unele elemente ale așa-numitului vocabular de bază sunt absente și, prin urmare, unul este obligat să reducă numărul de cuvinte din listă.

Glotocronologie modificată

Glotocronologia clasică propusă de Morris Swadesh a fost puternic criticată în anii 1960 și 1970, până la punctul în care a fost respinsă de mulți lingviști. Primele critici au fost ridicate deja în acei ani și au fost propuse unele modificări pentru a rezolva disputele în totalitate sau parțial. Reconsiderarea criticilor a dat naștere unei viziuni intermediare între respingerea completă a valorii glotocronologiei și entuziasmul cu care a fost primită inițial. Susținătorii glotohronologiei modificate susțin că, cu modificările adecvate, numărul de cuvinte înrudite este util pentru studierea diversificării familiilor de limbi și estimarea timpului de separare.

Van der Merwe, în 1966, a studiat efectul neomogenității în rata de substituție, împărțind lista de cuvinte în diferite grupuri și atribuind fiecărui grup propria sa rată de substituție. Această modificare ia în considerare faptul că într-o lungă perioadă de timp rata de substituție scade și, prin urmare, cuvintele cu cea mai mare rată de substituție tind să dispară mai întâi; în consecință, după un timp, cuvintele cu rate de substituție mai lente tind să crească în procente.

Dyen, James și Cole (1967) au studiat efectul presupunerii că fiecare semnificație are propria sa rată de substituție. Dacă împărțiți lista de vocabular de bază în două grupuri, cu N ₁ și respectiv N ₂ cuvinte, rata efectivă de înlocuire $\lambda _{t}\,$ ${\ displaystyle \ lambda _ {t} \,}$ ${\ displaystyle \ lambda _ {t} \,}$ satisface următoarea ecuație:

(N_{1}+N_{2})e^{-\lambda _{t}t}=N_{1}e^{-\lambda _{1}t}+N_{2}e^{-\lambda _{2}t}

{\ displaystyle (N_ {1} + N_ {2}) și ^ {- \ lambda _ {t} t} = N_ {1} e ^ {- \ lambda _ {1} t} + N_ {2} e ^ {- \ lambda _ {2} t}}

{\ displaystyle (N_ {1} + N_ {2}) și ^ {- \ lambda _ {t} t} = N_ {1} e ^ {- \ lambda _ {1} t} + N_ {2} e ^ {- \ lambda _ {2} t}}

deci rata efectivă în funcție de timp poate fi scrisă ca:

\lambda _{t}=-{\frac {1}{t}}\ln \left(n_{1}e^{-\lambda _{1}t}+n_{2}e^{-\lambda _{2}t}\right)\approx \left(n_{1}\lambda _{1}+n_{2}\lambda _{2}\right)-{\frac {n_{1}n_{2}}{2}}(\lambda _{1}-\lambda _{2})^{2}t+{\frac {n_{1}n_{2}}{6}}(n_{1}-n_{2})(\lambda _{1}-\lambda _{2})^{3}t^{2}+\dots

{\ displaystyle \ lambda _ {t} = - {\ frac {1} {t}} \ ln \ left (n_ {1} e ^ {- \ lambda _ {1} t} + n_ {2} e ^ { - \ lambda _ {2} t} \ right) \ approx \ left (n_ {1} \ lambda _ {1} + n_ {2} \ lambda _ {2} \ right) - {\ frac {n_ {1} n_ {2}} {2}} (\ lambda _ {1} - \ lambda _ {2}) ^ {2} t + {\ frac {n_ {1} n_ {2}} {6}} (n_ { 1} -n_ {2}) (\ lambda _ {1} - \ lambda _ {2}) ^ {3} t ^ {2} + \ dots}

{\ displaystyle \ lambda _ {t} = - {\ frac {1} {t}} \ ln \ left (n_ {1} e ^ {- \ lambda _ {1} t} + n_ {2} e ^ { - \ lambda _ {2} t} \ right) \ approx \ left (n_ {1} \ lambda _ {1} + n_ {2} \ lambda _ {2} \ right) - {\ frac {n_ {1} n_ {2}} {2}} (\ lambda _ {1} - \ lambda _ {2}) ^ {2} t + {\ frac {n_ {1} n_ {2}} {6}} (n_ { 1} -n_ {2}) (\ lambda _ {1} - \ lambda _ {2}) ^ {3} t ^ {2} + \ dots}

unde este:

n_{1}={\frac {N_{1}}{N_{1}+N_{2}}},\ n_{2}={\frac {N_{2}}{N_{1}+N_{2}}}

{\ displaystyle n_ {1} = {\ frac {N_ {1}} {N_ {1} + N_ {2}}}, \ n_ {2} = {\ frac {N_ {2}} {N_ {1} + N_ {2}}}}

{\ displaystyle n_ {1} = {\ frac {N_ {1}} {N_ {1} + N_ {2}}}, \ n_ {2} = {\ frac {N_ {2}} {N_ {1} + N_ {2}}}}

, indicați procentul de cuvinte din grupele 1 și respectiv 2.

\lambda _{1},\lambda _{2}\,

{\ displaystyle \ lambda _ {1}, \ lambda _ {2} \,}

{\ displaystyle \ lambda _ {1}, \ lambda _ {2} \,}

sunt cuvintele rate de înlocuire din fiecare grup.

Se poate întâmpla că $\lambda _{t}\,$ ${\ displaystyle \ lambda _ {t} \,}$ ${\ displaystyle \ lambda _ {t} \,}$ , pentru perioade scurte de separare $t\approx 0$ ${\ displaystyle t \ approx 0}$ ${\ displaystyle t \ approx 0}$ , presupuneți valoarea medie între rata de separare a celor două grupuri.

Kruskal, Dyen și Black au studiat estimarea divergenței în timp, în plus față de rata de înlocuire. Sankoff (1973) a sugerat introducerea unui parametru de împrumut prin acceptarea prezenței sinonimelor; de asemenea, a evaluat combinația diferitelor modificări. ^[3]

Plecând de la lucrarea lui Sankoff privind divergența genetică a populațiilor într-un context biologic dat, Embleton (1981) a derivat o versiune simplificată pentru a fi aplicată în contextul lingvistic. Autorul a arătat cu câteva simulări că acest model produce rezultate bune. Progresele statistice într-un domeniu diferit, studiul filogenetic al variațiilor ADN-ului în timp, au produs studii care aplică aceste rezultate contextului lingvistic, reînnoind interesul pentru glotocronologie. Toate aceste metode au arătat o eficacitate mai mare decât cele anterioare și permit calibrarea punctelor arborelui filogenetic pornind de la evenimente databile, interpolând continuu ratele de înlocuire; în acest fel, presupunerea inițială a unei rate de înlocuire constantă nu este necesară. ^[4]

Metoda lui Starostin

Lingvistul rus Serghei Starostin .

O altă încercare de a introduce modificări ale glotohronologiei tradiționale a fost făcută de lingvistul rus Sergei Starostin , care a propus următoarele schimbări:

Eliminați cuvintele împrumutate , care sunt un factor perturbator care modifică rezultatele; Sarostin se concentrează asupra schimbărilor datorate „ înlocuirii naturale ” a cuvintelor în aceeași limbă. Erorile care rezultă din necorectarea acestui factor sunt principala cauză pentru care estimarea Swadesh a fost de 14 substituții pe mileniu în lista de sute de cuvinte de bază (adică o rată de 0,14), în timp ce rata reală este mult mai lentă (de ordinul 0,05 sau 006 pe mileniu). Dacă introducem această corecție, eliminăm critica susținută de lingviștii Knut Bergsland și Voigt, deoarece pe baza analizei datelor riksmal ( limba norvegiană derivată din limba daneză ), vedem că lista de bază include 15- 16 împrumuturi din alte limbi germanice , în principal daneză.
Rata de înlocuire nu este chiar constantă, dar variază în timp. Acest lucru poate fi atribuit cel puțin doi factori diferiți:
- Posibilitatea ca o lemă X să fie înlocuită cu o lemă Y crește cu timpul de la care X este folosit într-o limbă; acest efect poate fi văzut ca o „ îmbătrânire a cuvintelor ”, corelată empiric cu faptul că există o „ eroziune ” treptată a sensului primar cauzată de greutatea dobândită de sensurile secundare dezvoltate din cea originală ( schimbare semantică ).
- Luate individual, cuvintele dintr-o listă de vocabular au rate diferite de substituție (de exemplu, cuvântul „ I ” în toate limbile este mult mai rezistent la substituție decât cuvântul „ galben ”). După cum sa menționat deja, cuvintele mai puțin stabile tind să dispară mai întâi, astfel încât, pe măsură ce trece timpul, procentul de cuvinte considerate mai rezistente la schimbare tinde să crească. Formularea propusă de Starostin pentru a ține cont de dependența de stabilitatea individuală a cuvintelor, ia următoarea formă:

T_{s}={\sqrt {\frac {\ln(p_{c})}{-L_{c}}}}

{\ displaystyle T_ {s} = {\ sqrt {\ frac {\ ln (p_ {c})} {- L_ {c}}}}}

{\ displaystyle T_ {s} = {\ sqrt {\ frac {\ ln (p_ {c})} {- L_ {c}}}}}

care îl înlocuiește pe cel original propus de Swadesh:

T_{s}={\frac {\ln(p_{c})}{\ln(p_{0})}}

{\ displaystyle T_ {s} = {\ frac {\ ln (p_ {c})} {\ ln (p_ {0})}}}

{\ displaystyle T_ {s} = {\ frac {\ ln (p_ {c})} {\ ln (p_ {0})}}}

Antichitatea unor familii lingvistice

S-au făcut calcule pentru a estima vechimea unor familii de limbi . Dintre familiile cu antichitate sau adâncime temporală mai mică de 5.000 de ani (50 de secole), există practic toate familiile bine stabilite, pentru care a fost posibil să se facă o reconstrucție adecvată (RA) a aspectelor protolingvului , în adăugare la unele familii în care relația dintre limbi nu este foarte controversată: ^[5] ^[6]

Limbi indo-europene (RA, Eurasia , 70 de secole)
Limbi sinotibetane (RA, Orientul Îndepărtat , 60 de secole)
Limbi caucaziene sudice (RA, Eurasia , 40 de secole)
Limbi dravidiene (RA, subcontinentul indian , 40 de secole)
Limbi austronesiene (RA, Asia de Sud-Est , Oceania și Taiwan , 35 de secole)
Limbi Tai-Kadai (RA, Asia de Sud-Est , 30 de secole)
Limbi Hmong-Mien (RA, Asia de Sud-Est , 40 de secole)
Limbi eniseiene (RA, Siberia , 30 de secole)
Limbi chukotko-kamciatke (RA, Siberia , 40 de secole)
Limbi eschimo-aleute (RA, Siberia , 30 de secole)
Limbi native (RA, America de Nord , 35 de secole)
Limbi algice (RA, America de Nord , 30 de secole)
Limbi Iroquois (RA, America de Nord , 35 de secole)
Limbi salish (RA, America de Nord , 45 de secole)
Limbi caddoane (RA, America de Nord , 33 de secole)
Limbi uto-aztece (RA, America de Nord , 48 de secole)
Limbi Zapotec (RA, Mesoamerica , 25 de secole)
Limbi maya (RA, Mesoamerica , 41 de secole)
Limbi Misumalpa (RA, America Centrală , 43 de secole)

Pentru unele superfamilii sau macrofamilii (MF) și familii mai controversate în care reconstrucția a întâmpinat dificultăți mai mari (DR), ^[7] profunzimea temporală este mai mare de 50 de secole:

Limbi altaice (MF, Eurasia, 77 de secole)
Limbi uralice (DR-b, Eurasia, 60 de secole)
Limbi afro - asiatice (DR-c, Africa de Nord și Orientul Mijlociu , 113 secole)
Limbi Niger-Congo (DR-a, Africa , 100 de secole)
Limbi nilo-sahariene (DR-c, Africa , 150 de secole)
Limbi khoisane (MF, Africa de Sud , 111 secole)
Limbi Trans-Noua Guinee , (MF, Noua Guinee , 100 de secole)
Limbi aborigene australiene (MF, Australia , 95 de secole)
Limbi otomang , (DR-b?, Mesoamerica , 55-60 sec.)
Limbi Hokan , (MF, Mesoamerica , 88 de secole)

Metodologie

Lista de cuvinte de bază

Metoda inițială presupunea că vocabularul de bază al unei limbi are un înlocuitor care apare în mod constant în toate limbile și culturile și, prin urmare, poate fi folosit ca o măsură a trecerii timpului. Metoda folosește o listă de cuvinte, compilată inițial de Swadesh, care se presupune că poate rezista la cuvinte împrumutate . Lista elaborată de Swadesh în 1952 a inclus o listă de 200 de termeni, pe care apoi i-a redus la 100 în 1955. ^[8] Această din urmă versiune este cea mai folosită de lingviștii moderni.

Vocabularul de bază a fost conceput pentru a include conceptele esențiale comune tuturor limbajelor umane (cum ar fi pronumele, părțile corpului, fenomenele cerești, verbele de bază, numerele unu și doi), eliminând acele concepte care sunt specifice unei anumite culturi sau timp. Curând s-a dovedit că situația ideală este de fapt imposibilă și că conceptele exprimate trebuiau adaptate la limbile pentru a fi comparate. Prin urmare, alți lingviști au dezvoltat liste alternative sau au folosit un set mai restrâns de semnificații.

În acest moment, se măsoară procentul de cuvinte înrudite , adică cuvinte care au o origine comună. Se presupune că două limbi s-au separat cu atât mai recent, cu cât lista cuvintelor înrudite este mai extinsă.

Notă

^ ^a ^b Sheila Embleton (1992). LINGVISTICĂ ISTORICĂ: Concepte matematice . În W. Bright (Ed.), International Encyclopedia of Linguistics, p. 131-133
^ Holm, Hans J. (2007). Noul Arboretum al „Copacilor” indo-europeni; Pot noi algoritmi să dezvăluie filogenia și chiar preistoria IE? . Journal of Quantitative Linguistics 14-2: 167-214
^ Sankoff, Lexicostatistică complet parametrizată , 1972.
^ Gray, RD & Atkinson, QD (2003), Times-divergence Language-tree sprijină teoria anatoliană de origine indo-europeană , Nature, 426, pp. 435-439.
^ Søren Wichmann , 2008, Anexe .
^ Swadesh, Morris, (1963). Nuevo Ensayo de Glotocronología Yutonahua . INAH Anales, 15: 263-302.
^ Există diferite tipuri de „dificultăți de reconstrucție”: (DR-a) nu este disponibilă o reconstrucție adecvată, (DR-b) lista termenilor reconstituiți abia depășește 100 de unități, (DR-c) reconstrucțiile diferiților autori au discrepanțe semnificative .
^ Swadesh, Morris. (1955). Către o mai mare acuratețe în datarea lexicostatistică . Jurnalul internațional de lingvistică americană, 21 , 121-137

Bibliografie

Arndt, Walter W. (1959). Performanța glotohronologiei în limba germanică . Limba , 35 , 180–192.
Bergsland Knut & Vogt, Hans. (1962). Despre validitatea glotocronologiei . Anthropology Current, 3 , 115–153.
Brainerd, Barron (1970). Un proces stocastic legat de schimbarea limbii . Journal of Applied Probability, 7, 69-78.
Callaghan, Catherine A. (1991). Utian și lista Swadesh . În JE Redden (Ed.), Lucrări pentru conferința de limbă indiană americană, desfășurată la Universitatea din California, Santa Cruz, iulie și august 1991 (pp. 218-237). Lucrări ocazionale despre lingvistică (nr. 16). Carbondale: Departamentul de lingvistică, Southern Illinois University.
Campbell, Lyle. (1998). Lingvistică istorică; O introducere [Capitolul 6.5]. Edinburgh: Edinburgh University Press. ISBN 0-7486-0775-7 .
Chretien, Douglas (1962). Modelele matematice ale glotocronologiei . Limbă, 38, 11–37.
Crowley, Terry (1997). O introducere în lingvistica istorică . Ed. A 3-a Auckland: Oxford Univ. Press. pp. 171–193.
Dyen, Isidore (1965). O clasificare lexicostatistică a limbilor austroneziene. International Journal of American Linguistics, Memoir 19.
Gray, RD & Atkinson, QD (2003): Timpii de divergență limbă-arbore susțin teoria anatoliană de origine indo-europeană. Natura, 426-435-439.
Gudschinsky, Sarah. (1956). ABC-ul lexicostatisticii (glotocronologie) . Cuvânt, 12 , 175–210.
Haarmann, Harald. (1990). Vocabular de bază și contacte lingvistice; deziluzia glotocronologiei . În Indogermanische Forschungen 95: 7ff.
Hockett, Charles F. (1958). Wayback Machine , (Cap. 6). New York: Macmillan.
Hoijer, Harry. (1956). Lexicostatistică: o critică . Limbă, 32 , 49-60.
Holm, Hans J. (2003). Capcana proporționalității. Sau: Ce este în neregulă cu subgruparea lexicostatistică . Indogermanische Forschungen, 108 , 38–46 .
Holm, Hans J. (2005). Genealogische Verwandtschaft. Kap. 45 în Quantitative Linguistik; ein internationales Handbuch . Herausgegeben von R. Köhler, G. Altmann, R. Piotrowski, Berlin: Walter de Gruyter.
Holm, Hans J. (2007). Noul Arboretum al „Copacilor” indo-europeni; Pot noi algoritmi să dezvăluie filogenia și chiar preistoria IE? . Jurnalul de lingvistică cantitativă, 14-2: 167-214
Hymes, Dell H. (1960). Lexicostatistică până acum . Anthropology Current, 1 (1), 3-44.
McWhorter John. (2001). Puterea lui Babel . New York: Freeman. ISBN 978-0-7167-4473-3 .
Urzică, Daniel. (1999). Diversitatea lingvistică a Americii poate fi reconciliată cu o colonizare recentă . în PNAS, 96 (6): 3325-9.
Sankoff, David (1970). Cu privire la rata de înlocuire a relațiilor cuvânt-semnificație . Limbă, 46.564-569.
Sjoberg, Andree; & Sjoberg, Gideon. (1956). Probleme în glotocronologie . American Anthropologist, 58 (2), 296–308.
Starostin, Serghei. Metodologia comparării pe termen lung . 2002. pdf
Thomason, Sarah Gray și Kaufman, Terrence. (1988). Contact de limbă, creolizare și lingvistică genetică . Berkeley: University of California Press.
Tischler, Johann, 1973. Glottochronologie und Lexikostatistik [Innsbrucker Beiträge zur Sprachwissenschaft 11]; Innsbruck.
Wittmann, Henri (1969). O anchetă lexico-statistică asupra diacroniei hititei. Indogermanische Forschungen, 74.1–10. [1]
Wittmann, Henri (1973). Clasificarea lexicostatistică a limbilor creole franceze. în Lexicostatistics in genetic linguistics: Proceedings of the Yale conference, 3-4 aprilie 1971, dir. Isidore Dyen, 89–99. La Haye: Mouton.[2]
Zipf George Kingsley (1965). Psihobiologia limbajului: o introducere în filologia dinamică. Cambridge, MA: MITPress.

Portalul lingvistic

Portalul Științelor Pământului

[Embleton-1] Sheila Embleton (1992). LINGVISTICĂ ISTORICĂ: Concepte matematice . În W. Bright (Ed.), International Encyclopedia of Linguistics, p. 131-133

[2] Holm, Hans J. (2007). Noul Arboretum al „Copacilor” indo-europeni; Pot noi algoritmi să dezvăluie filogenia și chiar preistoria IE? . Journal of Quantitative Linguistics 14-2: 167-214

[3] Sankoff, Lexicostatistică complet parametrizată , 1972.

[4] Gray, RD & Atkinson, QD (2003), Times-divergence Language-tree sprijină teoria anatoliană de origine indo-europeană , Nature, 426, pp. 435-439.

[5] Søren Wichmann , 2008, Anexe .

[6] Swadesh, Morris, (1963). Nuevo Ensayo de Glotocronología Yutonahua . INAH Anales, 15: 263-302.

[7] Există diferite tipuri de „dificultăți de reconstrucție”: (DR-a) nu este disponibilă o reconstrucție adecvată, (DR-b) lista termenilor reconstituiți abia depășește 100 de unități, (DR-c) reconstrucțiile diferiților autori au discrepanțe semnificative .

[swadesh1955-8] Swadesh, Morris. (1955). Către o mai mare acuratețe în datarea lexicostatistică . Jurnalul internațional de lingvistică americană, 21 , 121-137

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]