Banco de voces para uso forense

Contará con parámetros acústicos y sociolingüísticos; tiene una clasificación por nivel de estudios, género y edad

Ene 23, 2020

El Grupo de Lingüística Forense de la licenciatura en Ciencia Forense de la Facultad de Medicina está creando, bajo el nombre de Corpus de lengua oral del español de México (CLOE México), un banco de voces con aplicación forense que, a diferencia de otros similares de las instituciones de procuración e impartición de justicia del país, contará con parámetros acústicos y sociolingüísticos para la comparación de voz.

Los bancos de voces de la Fiscalía General de la República y de la Procuraduría General de Justicia de la Ciudad de México se utilizan para cotejar sólo las características acústicas de una voz dubitada (es decir, de quien se desconoce su autoría) con las de más de 14 mil voces que contienen.

“Son grabaciones de procesados, indiciados y sentenciados por algún delito, así como de personal que labora en las instituciones de procuración e impartición de justicia”, dijo Fernanda López Escobedo, coordinadora del citado grupo y expertos en fonética forense y en lingüística forense y computacional.

La nación tiene también un corpus que se usó para crear el Atlas lingüístico de México (década de los años 70 del siglo pasado) integrado por voces grabadas en cintas magnetofónicas. Es una buena referencia, pero no refleja la situación actual de las diversas entidades.

Hay otros más recientes, como el Corpus sociolingüístico de la Ciudad de México, elaborado por El Colegio de México; forma parte del proyecto PRESEA, que tiene como objetivo la creación de un corpus de lengua española hablada representativo del mundo hispánico. Sin embargo, no está pensado para su aplicación en el ámbito forense y no se puede acceder a su material oral.

Más allá de lo acústico

“En México actualmente se comparan las características acústicas de una voz dubitada grabada durante una llamada de extorsión o de secuestro (dos de los delitos más frecuentes que presentan este tipo de evidencia) con las de las voces de los bancos disponibles, para determinar las probabilidades de coincidencia de aquélla con algunas de éstas”, apuntó López Escobedo.

Ya que la mayoría de las grabaciones de esas llamadas telefónicas están dañadas a nivel acústico o tienen mucho ruido o, como son de celular, el ancho de banda del teléfono no permite registrar ciertas frecuencias, no se puede hacer un cotejo adecuado con los softwares que se utilizan en las procuradurías.

Es importante analizar el sonido a nivel físico (la acústica), pero también el contexto social del hablante: dónde nació y creció, y qué modismos usa (los adultos mayores dicen palabras que los jóvenes de hoy desconocen).

“Asimismo, se tiene que considerar que cada lugar cuenta con un repertorio léxico específico. Si en una grabación se escucha que alguien dice ‘abanico de techo’, de seguro no es chilango, pues aquí, en Ciudad de México, se dice ‘ventilador’, sino del norte del país”, indicó la especialista.

Algunas características lingüísticas se encuentran asociadas a ciertas áreas geográficas de México. Por ejemplo, las personas de la costa de Veracruz o de Acapulco aspiran las s, debido a lo cual dicen “pehcado”.

“Y desde el punto de vista lingüístico, los yucatecos realizan glotalizaciones de vocales, es decir, producen un sonido vocálico con un punto de articulación muy atrasado, hacia la glotis. En cuanto a los chilangos, tienen cierta entonación y, al contrario de los hablantes de otros estados, pronuncian una ‘s’ más estable”, agregó López Escobedo.

Prueba en la cabina de audio de la Licenciatura en Ciencia Forense donde se graba el Corpus de lengua oral del español de México. Foto: cortesía de Fernanda López.

Lista de patrones lingüísticos

El banco de voces que se desarrolla en la UNAM tiene una clasificación por nivel de estudios (primaria, secundaria, preparatoria, licenciatura y posgrado), género (masculino y femenino) y edad (jóvenes, adultos y adultos mayores).

Seccionado también por rasgos lingüísticos, permitirá cerrar el conjunto de voces con las que se puede comparar una voz dubitada, así como disminuir el error en la comparación.

López Escobedo y sus colaboradores ya elaboraron y analizan una lista de 36 patrones lingüísticos, como la aspiración de la s y el debilitamiento de la d a nivel fonético. Su objetivo es determinar si se correlacionan para, de esa manera, acortar la lista y así facilitar el trabajo a peritos que saben de fonética pero no tienen el oído entrenado de un lingüista.

“La idea es incluir únicamente fenómenos que no necesiten tanta experiencia y sean fáciles de identificar a nivel auditivo, como la aspiración de la ‘s’. Además de establecer las características acústicas de una voz, es fundamental disponer de parámetros sociolingüísticos que permitan efectuar una comparación forense de voz cualitativa cuando las condiciones acústica de la grabación impidan su análisis automático, o un perfilamiento del hablante.”

Desarrollo de sintetizadores, entre otras aplicaciones

Este banco de voces podría aprovecharse igualmente como población de referencia del español de México, ya que muchas veces, cuando se hace una comparación forense de voz, se utiliza una medida llamada LR (siglas de likelihood ratio), la cual requiere forzosamente conocer la tipicidad de una característica en una población, por ejemplo, qué tan típico es que un mexicano cecee.

Hace unos meses, la voz atribuida a Frida Khalo en una grabación fue reclamada como suya por varias actrices. En un caso así podría servir para descartar o confirmar que se trata de la voz de alguna de ellas, pero no para atribuírsela a Frida Kahlo, pues para eso se necesitaría una grabación indubitada de la pintora con que cotejarla.

Además, agregó la experta, comparar la voz cantada y hablada de una misma persona es un factor que añade variabilidad en los datos; es por esto que en este Corpus se recopilan distintos modos de habla: espontánea, con diferentes entonaciones, leyendo, dando instrucciones, entre otros aspectos.

“También podría ser útil en el desarrollo de sintetizadores de voz y en el entrenamiento de sistemas de reconocimiento de voz para aplicaciones tecnológicas de lenguaje en coches y casas inteligentes”, finalizó López Escobedo.

Histogramas de parámetros acústicos de diferentes contextos fonéticos. Imagen: cortesía de Fernanda López.

G5110