x
1

Lexicoestadística



La glotocronología es una técnica para calcular la separación temporal o divergencia entre dos lenguas que se suponen emparentadas.

Está basada en el porcentaje de palabras o cognados que son substituidos por otras palabras a lo largo del tiempo. Morris Swadesh, basándose en datos de diferentes familias lingüísticas, cuya historia es conocida por documentos, estimó que debido a cambios internos y aportaciones externas, aproximadamente el 14 % de las palabras básicas del vocabulario de una lengua serán sustituidas cada mil años.

La glotocronología es un método de estudio cuyos resultados no pueden ser precisos. No obstante, está propuesta para la investigación de la evolución de aquellas lenguas que carecen de textos escritos, por lo que hay que descartar el método comparativo, usado para la reconstrucción del indoeuropeo y buscar alternativas de investigación.

Explícitamente los dos supuestos fuertes en los que se basa el método glotocronológico son:

En forma de ecuación, estos dos supuestos se pueden expresar de la siguiente manera. Si llamamos P(t) al porcentaje esperado de palabras básicas que retiene una lengua después del período t,[1]​ entonces el primer supuesto puede escribirse en forma matemática como:

O equivalentemente si integramos la ecuación diferencial anterior:

El segundo supuesto lleva a que α debe ser una constante universal para todas las lenguas del mundo, que se debe calibrar a partir de datos experimentales de reemplazo de vocabulario básico en las lenguas con largos registros escritos. Las estimaciones sugieren que después de 10 siglos de evolución histórica el promedio, medido para varias familias de lenguas, está en torno al 14% del vocabulario básico, esto lleva a la siguiente estimación de α:

A partir de esa estimación, el tiempo de separación Ts (medido en milenios) puede estimarse comparando el porcentaje de cognados retenidos pC (expresado en tanto por uno) como:

, de una lengua con su lengua madre, , de dos lenguas hermanas

Donde p0 = 0.86 (= 86 %) es el porcentaje de retención por milenio estimado por Swadesh (= 100 % - 14 %). El tiempo calcuado así ha sido comparado con el del carbono 14 en materia biológica, usado en arqueología. Con el método se podría calcular la fecha en que dos o más lenguas emparentadas habrían formado un tronco común. Efectivamente, los dos métodos se parecen, pero difieren en un hecho esencial: la desintegración del C14 siempre es constante. No hay nada que lo cambie, ni el calor, ni el frío ni reacciones con otros elementos químicos.

Morris Swadesh estimó que la tasa de reemplazo en la lista de 100 términos de vocabulario básico que desarrolló estaba entorno al 14 %, por lo que la tasa de retención es p0 = 0.86 (= 86 %). Más tarde, Robert Lees cambió el valor medio, calculándolo en el 80.5 % cada milenio. Otros lingüistas han estimado tasas de retención de 92-95 % eliminando los préstamos y centrándose solamente en el reemplazo "nativo" dentro de la lengua.

Puede demostrarse sin embargo que si la lista está formada por términos de diferente estabilidad (tasa de cambio individual), entonces la tasa de cambio de la lista no puede ser constante sino decreciente a medida que las palabras más volátiles o inestables van siendo reemplazadas, pues la proporción de palabras retenidas más estables va aumentado (en proporción a las palabras retenidas). Este hecho ha sido analizado en diversas modificaciones posteriores de la glotocronología.

Las fluctuaciones estadísticas también pueden ser importantes ya que el número de cognadas retenidas sigue una distribución binomial del tipo:

Para diferentes valores de la tasa de retención se puede ver que el valor esperado del tiempo de separación se separa del valor teórico:

La metodología original ha sido repetidamente criticada. Eugenio Coseriu (1962), por ejemplo, aportó algunos datos tomados de las lenguas románicas que ilustraban que su uso podía conducir a inexactitudes importantes. Las principales objeciones que se han planteado contra la formulación de Swadesh son siguientes:

La glotocronología clásica propuesta por Morris Swadesh fue severamente criticada en los años 1960 y 1970, al punto que fue desechada por muchos lingüistas. Algunas de las críticas fueron abordadas ya en esos años y se propusieron modificaciones que salvaban algunas de las críticas total o parcialmente. La reconsideración de las críticas hizo surgir una visión intermedia entre el rechazo completo al valor de la glotocronología y el entusiasmo con que fue recibida inicialmente. Los proponentes de la glotocronología modificada sostienen que con importantes modificaciones la idea de usar el recuento del número de cognados resulta útil par estudiar la diversificación de las familias lingüísticas y estimar tiempos de separación.

Van der Merwe (1966) estudió el efecto de la inhomogeneidad en las tasas de reemplazo, dividiendo la lista de vocabulario en varios grupos y cada grupo con su propia tasa. Esa modificación tiene el efecto de que a largo plazo la tasa de reemplazo media disminuye, ya que al principio las palabras con mayor tasa de cambio desaparecen y pasado un tiempo la proporción de palabras con tasas de reemplazo más lenta aumentan en proporción. Dyen, James y Cole (1967) estudiaron el efecto de permitir que cada significado tenga su propia tasa de cambio. Si se divide la lista de vocabulario básico en dos grupos con N1 y N2 palabras entonces la tasa de cambio efectiva satisface:

Por lo que la tasa efectiva dependiente del tiempo se puede escribir como:

Donde:

Puede verse que para tiempos de separación pequeños se comporta como el promedio de la tasa de variación de ambos grupos.

Finalmente Kruskal, Dyen y Black estudiaron simultáneamente la estimación de divergencia con el tiempo además de la tasa de reemplazo. Sankoff (1973) sugirió introducir un parámetro de préstamo y permitió la ocurrencia de sinónimos. La combinación de varias de esas mejoras se considera en Sankoff.[2]​ A partir de un trabajo de Sankoff sobre la divergencia genética de poblaciones en un contexto biológico, Embleton (1981) deriva una versión simplificada en el contexto lingüístico. Esta autora mostró mediante un cierto número de simulaciones que usar este modelo proporciona buenos resultados. Colateralmente, las mejoras en la metodología estadística en un campo diferente, el estudio de los cambios en el ADN a lo largo del tiempo, ha generado trabajos que usan esos resultados en el contexto lingüístico y han renovado el interés en la glotocronología. Todos esos métodos son más robustos que los empleados anteriormente y permiten calibrar puntos en el árbol filogenético a partir de acontecimientos históricos fechables, interpolando de manera continua las tasas de cambio entre ellos. El resultado es que la asunción de una tasa de cambio constante ya no es necesaria.[3]

Otro intento de introducir modificaciones en la glotocronología tradicional fue llevado a cabo por el lingüista ruso Serguéi Stárostin, que propuso que las siguiente modificaciones:

Que reemplaza a la fórmula del Swadesh

Se han hecho algunos cálculos estimativos de la antigüedad de algunas familias de lenguas. Entre las familias con antigüedades o profundidades temporales inferiores a 5000 años (50 siglos) aparecen la práctica totalidad de las familias bien establecidas para las que se han podido reconstruir adecuadamente (RA) los aspectos cruciales de la protolengua, además de algunas otras familias donde el parentesco entre las lenguas resulta poco controvertido:[4][5]

Para algunas macrofamilias (MF) y familias más controvertidas en que la reconstrucción ha encontrado más dificultades (DR),[6]​ se tienen profundidades temporales superiores a 50 siglos:




Escribe un comentario o lo que quieras sobre Lexicoestadística (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!