Investigadores israelĂ­es utilizan la inteligencia artificial para traducir el acadio

Expertos de la Universidad de Tel Aviv, en colaboración con la Universidad Ariel, crearon un programa para descifrar una lengua antigua difícil de interpretar. Una traducción "automática" y precisa de caracteres cuneiformes al inglés. Un ejemplo de colaboración entre el hombre y la máquina en un campo en el que faltan expertos. Hasta la fecha, aún quedan por descifrar cientos de miles de tablillas. 


Tel Aviv (AsiaNews) - Explotar el potencial de la inteligencia artificial (IA) para descifrar una lengua arraigada en el pasado y a menudo difícil de interpretar, facilitando la tarea de historiadores, lingüistas y traductores. Es lo que ha hecho un grupo de investigadores israelíes de la Universidad de Tel Aviv (TAU) en colaboración con la Universidad Ariel, que desarrollaron un modelo que permite la "traducción automática" de textos acadios en caracteres cuneiformes al más común y comprensible inglés moderno.

Los asiriólogos, especializados en el estudio arqueológico, histórico, cultural y lingüístico de la antigua Mesopotamia, llevan años intentando interpretar textos en cuneiforme, una de las formas de escritura más antiguas que se conocen. La referencia a la "forma de cuña" recuerda su uso en el pasado, cuando los signos se imprimían en una tablilla de arcilla. 

El acadio, lengua hablada en la antigua Mesopotamia (lo que corresponde al actual Irak), era una lengua semítica oriental utilizada sobre todo por asirios y babilonios. Se trata del idioma semítico más antiguo que se conoce, y se basa en un sistema de escritura explotado por primera vez por los sumerios. Se dice que la lengua debe su nombre a la ciudad de Akkad, la ciudad del rey Sargón, fundador y padre del imperio, el mayor centro habitado de la época, aunque hasta ahora no hay vestigios ciertos de ella.

A lo largo de las décadas, los arqueólogos han desenterrado cientos de miles de tablillas de arcilla escritas en cuneiforme que se remontan al año 3.400 a.C., un número muy superior a los estudiosos que capaces de comprenderlas y traducirlas, que son muy pocos. Shai Gordin, de la Universidad Ariel, Jonathan Berant y Omer Levy, de la TAU, junto con otros colegas, han compartido recientemente los frutos de sus estudios en la revista especializada Pnas en un artículo titulado "Translating from Akkadian to English by Neural Machine Translation" (Traducción del acadio al inglés mediante traducción automática neuronal). 

Durante la fase de estudio y diseño, el equipo desarrolló dos versiones del modelo, una de las cuales traducía el acadio a partir de representaciones de signos cuneiformes en alfabeto latino y la otra a partir de representaciones unicode de signos cuneiformes. La primera, correspondiente a la transliteración latina, es la que mejores resultados ha dado a lo largo del tiempo, con una puntuación de 37,47 en la Best Bilingual Evaluation Understudy 4 (BLEU-4), un parámetro utilizado para evaluar la correspondencia entre la traducción humana y la artificial de un mismo texto. El programa, como explicaron en una nota, se mostró especialmente eficaz a la hora de traducir frases cortas de menos de 120 caracteres; al superar este límite aparecían las "alucinaciones" (un texto sintácticamente correcto, pero impreciso). 

El programa podría resultar especialmente útil en una primera fase de traducción, en la categoría de la "colaboración hombre-máquina", para luego dejar margen a la intervención humana para refinar el texto traducido en la versión final. Existen cientos de miles de manuscritos cuneiformes relacionados con la vida política, social, económica y científica de la antigua Mesopotamia. "Y la mayoría de estos textos -explicaron los investigadores al Jerusalem Post- siguen siendo inaccesibles para el limitado número de expertos capaces de comprenderlos".

La traducción es un "proceso complejo" porque requiere no sólo la presencia de "personas que conozcan dos lenguas distintas", sino que también sean capaces de comprender "diferentes contextos culturales". En esta perspectiva, continuaron, "las herramientas digitales pueden ayudar" gracias a elementos como "el reconocimiento óptico de caracteres (OCR) y la traducción automática". Las lenguas antiguas, concluía la nota, plantean aún mayores problemas de complejidad porque "su lectura y comprensión requiere el conocimiento de una comunidad lingüística que desapareció hace mucho tiempo" y los textos mismos "pueden ser muy fragmentarios".