以色列学者用人工智能翻译阿卡德语

特拉维夫大学专家与阿里尔大学合作开发了一个程序来破译一种晦涩的古老语言。“自动”将楔形文字准确地翻译成英文。这是在缺乏专家的行业中一个人机协作的案例。截至目前,仍有数十万张泥板待破译。


特拉维夫(亚洲新闻)- 利用人工智能(AI)的潜力来解密一种晦涩的古老预言,从而促进历史学家、语言学家和翻译家的工作。特拉维夫大学 (Tau) 以色列研究人员与阿里尔大学合作开发了一种模型,可以将楔形文字的阿卡德语文本“自动翻译”成更常见、更容易理解的现代英语。

专门从事古代美索不达米亚考古、历史、文化和语言学研究的亚述学专家,多年来一直试图解读楔形文字文本,这是已知最古老的书写形式之一。“楔形”文字主要刻写在泥碑上。

阿卡德语在一种在古代美索不达米亚(即今天的伊拉克)使用的东闪米特语言,主要由亚述人和巴比伦人使用。阿卡德语是有史以来最古老的闪族语言,基于苏美尔人开创的书写系统。该语言的名字来源于阿卡德城,创建于帝国的创始人和祖先——萨尔贡国王,阿卡德城是当时最大的有人居住的中心,即使今天没有任何痕迹。

几十年来,考古学家已发掘出数十万块公元前 3400 年以楔形文字书写的泥板,远远超过能够理解和翻译楔形文字的少量学者。近期,Ariel 大学的 Shai Gordin、Tau 的 Jonathan Berant 和 Omer Levy 以及其他同事在专业期刊 PNAS上发表了一篇题为“使用神经机器将阿卡德语翻译成英语”的文章,分享了他们的研究成果。

在研究和设计阶段,工作组开发了两个版本的模型,其中一个从拉丁字母表中的楔形文字符号表示形式翻译成阿卡德语,另一个从楔形文字符号的 unicode 表示形式翻译而来。第一个与拉丁音译有关,随着时间的推移给出了最好的结果,在 Best Bilingual Evaluation Understudy 4 (Bleu4) 中总分 37.47。 学者们在一份说明中解释说,该程序在翻译少于 120 个字符的短句时被证明特别有效,之后便开始出现“幻觉”(文本语法正确,但不准确)。

该程序可能被证明在翻译的初级阶段特别有用,在“人机协作”的类别中,然后通过人工干预改进翻译文本。有成千上万的楔形文字手稿与古代美索不达米亚的政治、社会、经济和科学生活有关。“由于能够解读手稿的专家人数有限……学者们向耶路撒冷邮报解释说——大部分手稿仍无法被解读”。

翻译是一个“复杂的过程”,因为不仅需要“两种不同语言的鉴赏家”在场,还需要能够理解“不同文化领域”的人。从这个角度来看,他们继续说,“数字工具可以提供帮助”,这要归功于“光学字符识别 (Ocr) 和自动翻译”等元素。该说明总结道,古代语言提出了更为复杂的问题,因为“他们的阅读和理解需要了解早已消亡的语言社区”,而文本本身“可能非常零碎”。