Estudio físico y estadístico

Analizan la evolución de las palabras en 300 años

facebooktwittergoogle_plusredditpinterestlinkedinmail

Guadalupe Lugo, 27 de agosto de 2015

Investigadores de la UNAM realizaron un estudio en el que muestran, por primera vez, la forma en que ha evolucionado la frecuencia del uso de las palabras a lo largo de los tres últimos siglos. Los hallazgos fueron publicados en PLOS ONE, revista científica de reconocimiento internacional.

Con el empleo de herramientas de la física, matemáticas, estadística y de cómputo, Germinal Cocho, Jorge Flores y Carlos Pineda, del Instituto de Física (IF), en colaboración con Carlos Gershenson, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), y Sergio Sánchez, de la Facultad de Ciencias (FC), efectuaron la indagación para seis idiomas distintos: inglés, alemán, español, francés, italiano y ruso.

Pineda señaló que el propósito del proyecto es analizar las variaciones en el lenguaje; para ello, aprovecharon el proceso de escaneo masivo de libros de todo el mundo desde 1508 hasta 2012 (emprendido por Google).

“No sólo tenemos un corte en el tiempo de cómo es el lenguaje de hoy, sino cómo se ha modificado. Examinamos aspectos básicos, pues somos físicos y no lingüistas; vemos cuáles fueron las cien mil palabras más utilizadas cada año, con la idea de determinar los cambios.”

cult13_princ

Los físicos Germinal Cocho y Carlos Pineda. Fotos: Fernando Velázquez.

Principal hallazgo

Lo interesante es que, a pesar de las grandes revoluciones culturales y de que Alemania, por ejemplo, es muy diferente a Latinoamérica, todas las palabras, en los distintos idiomas, “parecen seguir un patrón similar: a mayor empleo de una, ésta tiene menor variable de rango, mientras que a menor uso, su cambio en el rango es mayor. Ese esquema fue nuestro principal hallazgo. Además, logramos modelarlo a partir de un caminante aleatorio”.

Entre los 20 sustantivos más utilizados en el año 1700 para el español destacan Dios, rey, cardenal y fe, mismos que en 2000 fueron sustituidos por vocablos como parte, Estado, años, vida y nacional.

El modelo de los universitarios les permitió determinar tres regímenes diferentes: cabeza, es decir, palabras estructurales más comunes; cuerpo, que comprende los vocablos de uso general, aquellos que se requieren para establecer una comunicación entre dos personas o para contar con un conocimiento básico del lenguaje, tal y como lo determinaron los lingüistas y, finalmente, la cola, que contiene términos más especializados.

La idea para modelar los cambios del rango de las palabras en el tiempo es una caminata aleatoria, en la que se escoge al azar el tamaño del siguiente paso, pero con cierta desviación estándar que indica qué tanto puede variar.

En este caso, la desviación estándar (el tamaño del paso) es proporcional al rango. Es decir, mientras más alto éste (menos uso de un término), potencialmente se moverá a más lugares (de manera aleatoria) cada año. Los más utilizados (intervalos menores) tienen pasos tan pequeños que en la práctica se mueven poco o nada, tal como sucede en los datos estudiados por los científicos universitarios.

Por ejemplo, el artículo en inglés the, es de bajo rango, pues su empleo es frecuente y así se ha mantenido en todos los momentos de la historia; no hay alteraciones significativas. “Lo que hicimos fue tomar una rebanada en el tiempo para determinar cuántas palabras diferentes estaban en el puesto 1713, por ejemplo; quizá en esa posición podría haber una o dos, o bien, hasta cien. Mientras más pequeño sea el rango inicial, las variaciones son menores, pero entre más alto sea, se incrementan porque los vocablos cambian con mayor facilidad”, detalló.

“Los lingüistas han estimado que hay un cuerpo de palabras común en todos los idiomas, un conjunto de uso frecuente que posibilita una comunicación básica que va desde las mil 500 a las tres mil. Éste es el primer modelo que lo confirma”, planteó Pineda.

Otra de las aportaciones es la posibilidad de hacer algunas predicciones estadísticas que podrían proporcionar información a los lingüistas.

Por último, el investigador emérito Germinal Cocho consideró que en física o en astronomía la Ley de Gravitación Universal de Newton, que describe la interacción gravitatoria entre distintos cuerpos con masa, “vale para las manzanas y planetas. Sin embargo, en fenómenos biosociales como el lenguaje no existe un factor único, son múltiples detalles que tienen mucho en común”.

cult13_tirafinal

Gráficos en que se muestra la frecuencia en el uso del lenguaje.