Un gran número de ellas cae en desuso y puede extinguirse

Recurren a la inteligencia artificial para preservar lenguas originarias

“Esta herramienta ayudará a que permanezcan vivas aunque sea de manera virtual, pues muchas de ellas carecen de hablantes”: Iván Vladimir Meza Ruiz, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

En México hay 68 lenguas nacionales, 11 familias y 364 variantes lingüísticas, pero muchas de ellas están cayendo en desuso y se dirigen a la extinción, señaló Iván Vladimir Meza Ruiz, investigador del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM.

“Del 15 % de hablantes de lenguas originarias de nuestro país que había en 1930, la cifra disminuyó al 6.2 % de la población nacional en 2020; además, quienes las usan son, en su mayoría, personas mayores, mientras las generaciones más jóvenes ya casi no las hablan”, reveló.

Para preservarlas y mantener un registro digital de ellas, el especialista del Departamento de Ciencias de la Computación del IIMAS y sus colaboradores utilizan la inteligencia artificial. “Esta herramienta ayudará a que las lenguas permanezcan vivas aunque sea de manera virtual, pues muchas de ellas carecen de hablantes”.

Ponente en la sexta sesión de la Cátedra Extraordinaria de Bioética organizada por el Programa Universitario de Bioética (PUB) de esta casa de estudios, Meza Ruiz expuso en línea el tema “Inteligencia artificial y lenguas originarias de México”.

Ante Carol Hernández Rodríguez, moderadora y coordinadora del evento, el especialista en la intersección entre el lenguaje humano y el cómputo reconoció que tecnológicamente saben cómo crear versiones paralelas de forma masiva y digital; sin embargo, dependen de reunir suficientes datos.

“No tenemos datos masivos de las lenguas originarias de México. Según datos de Wikipedia, del náhuatl clásico solamente hay 4 mil 272 artículos, del maya yucateco mil 201, del náhuatl central 224, del mixteco 113, del hñahñu 90, del purépecha 12 y del mixe del norte 10”.

Tecnológicamente saben cómo crear versiones paralelas de forma masiva y digital; sin embargo, dependen de reunir suficientes datos. Los existentes están sesgados hacia la música y hay escasos registros del habla, la cual es además un punto de contacto para la discriminación

Sostuvo que se enfrentan a un dilema ético, pues desde un ejercicio académico hay preferencia por la ciencia abierta, y muchas obras y documentos en estas lenguas están sujetas a autoría, tienen derechos morales y patrimoniales sobre la obra.

El experto consideró que la sociedad mexicana podría reforzar los ejes de acceso a estas lenguas mediante una estrategia digital, que ayudaría a muchas comunidades hablantes a acceder a la salud, justicia, educación, autonomía económica y a una lectura y plática en sus lenguas.

Muchas lenguas originarias de México son orales; por ello hay menos registros de ellas, pues enfrentan una problemática de dato biométrico.

“Los datos existentes están sesgados hacia la música y hay escasos registros del habla, la cual es además un punto de contacto para la discriminación”, afirmó.

El universitario comentó que la tecnología para conservar las lenguas originarias de México la conocen muy bien, pero éstas no están bien representadas en términos de datos lingüísticos.

“El siguiente trabajo es crear el ecosistema para recolectar datos, y de este modo poderlas conservar digitalmente para que haya registro de ellas”, finalizó.

También podría gustarte