Enfoque físico para analizar la evolución de las palabras

Los investigadores utilizan algoritmos para extraer información de grandes bases de datos y una ecuación maestra

Analizar cómo las palabras han estado presentes en diversos siglos y sistematizar cómo han pasado del auge al desuso, ahora es posible con un novedoso método de física que usa herramientas clásicas de las ciencias exactas para estudiar dicha evolución, un terreno propio de la lingüística.

Es una tendencia actual dentro de la física utilizar la metodología de esta disciplina en otros campos, como la biología y la medicina; sin embargo, hay en escala muy baja en temas humanísticos, afirmó Rosalío Fernando Rodríguez Zepeda del grupo de Sistemas Complejos del Instituto de Física (IF) y profesor de Física Estadística en la Facultad de Ciencias (FC).

La palabra Internet, por ejemplo, está en auge, aunque apenas apareció en 1971, mientras que tanque tuvo más uso durante las Primera y Segunda guerras mundiales.

Junto con los investigadores Germinal Cocho (en su último trabajo), Jorge Flores y Carlos Pineda, del IF; Carlos Gershenson, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas, y Sergio Sánchez, de la FC, Rodríguez exploró en este innovador planteamiento usando bases de datos gigantescas.

“Hoy en día, se dispone de una infraestructura impresionante y una tecnología muy avanzada para adquirir y manipular datos acerca de sistemas lingüísticos: los idiomas, el lenguaje, las palabras que aparecen y desaparecen. Son bases de datos enormes que fueron una motivación para examinar estos sistemas”, señaló el especialista universitario.

Dichas bases revelan, por ejemplo, cuáles vocablos y cuántas veces estuvieron en los libros impresos en función del tiempo, desde 1500 hasta 2018 en inglés, francés, alemán, italiano, ruso y español, y detallan cuando se mantenían o desaparecían.

“Tener esa información nos hizo indagar características como la frecuencia con que aparecen las palabras y cómo cambia esa propiedad”, explicó Rodríguez Zepeda.

Factores culturales, sociales y etimológicos

En su análisis, los físicos encontraron que la funcionalidad de los vocablos a lo largo del tiempo es muy errática, pues la aparición, desaparición y frecuencia con que se emplean depende de factores culturales, sociales y etimológicos.

“Este comportamiento es errático, aleatorio, lo que ocurre con frecuencia en propiedades y variables que describen a sistemas físicos, como un recipiente con gas, el cual está compuesto de gran cantidad de partículas que se mueven de manera complicada. Como no podemos predecir el de ellas, recurrimos a métodos estadísticos y estocásticos que se han desarrollado en la física”, detalló el universitario.

En el caso estadístico, los físicos disponen de algoritmos que permiten manipular, examinar y extraer información de enormes cantidades de datos, pero en estos estudios la variable tiempo está fija. En el procedimiento estocástico utilizan una ecuación llamada maestra, con variables que tienen un comportamiento estadístico que cambia en función del tiempo.

Analizaron 20 palabras en seis idiomas (español, inglés, francés, alemán, italiano y ruso) y su evolución.
Gráficas: cortesía del Instituto de Física.

Veinte palabras

En un artículo publicado recientemente en la revista Physica A, los universitarios analizaron 20 palabras en seis idiomas (español, inglés, francés, alemán, italiano y ruso) y su evolución. Estudiaron una propiedad del comportamiento a la que llamaron el rango.

“Les asociamos un número (por ejemplo, las veces que aparece) en un cierto intervalo de tiempo (por ejemplo, un siglo) y observamos cómo cambia en función de ello. Tratamos de dar una descripción dinámica de ese número. A ese número le llamamos el rango de la palabra”, expuso.

Clasificaron los vocablos de acuerdo con su rango, los que aparecen más veces tienen uno superior.

“Hicimos gráficas y curvas de cómo las 20 palabras examinadas en seis idiomas varían en un tiempo muy largo, y encontramos una alteración azarosa del rango en función del tiempo. Algunas ecuaciones aplican estos comportamientos. Usamos la ecuación maestra para describir la probabilidad con la que puede ir cambiando el rango. Ya no importa nada más el número de vocablos, cuantas veces aparecen y desaparecen; nos estamos fijando ahora y tratamos de describir la probabilidad con la que va a tomar alguno de esos valores en función del tiempo”, pormenorizó Rosalío Fernando Rodríguez.

Actualmente este grupo de físicos se encuentra en pláticas con uno de lingüistas de El Colegio de México para aplicar este procedimiento en diversos trabajos de investigación.

Este buscador de Google muestra una gráfica que refleja la frecuencia con la que una palabra es mencionada en textos de diferentes años.
También podría gustarte