“比方说,翻译口语中的‘梗’,人工智能之前不行,现在可以了。”童晔说,人工智能先把“梗”变成平铺直叙的语言,再从目标语言中寻找一种相应的“梗”,这更符合“信达雅”的翻译要求。
精确度如何实现的呢?一些网文平台发布的资料显示,正如人类翻译受自身知识面的限制一样,AI模型达到的能力范围也受到语料范围的限制,所以要尽可能丰富地给AI“喂料”。平台基于自然语言理解技术,对网文内容进行深入挖掘。通过对大量网文内容和优质社区内容的标注和识别,使机器更好地理解网文内容。比如,AI可以自动识别角色、场景、题材、故事脉络等信息,构建网文的整体知识图谱。目前,AI翻译能够较好地翻译网文特殊领域中的词、句、段落,包括人名、地名以及类似“金丹”“解药”这种特有元素词,还能识别出各种代词指代的对象,尽可能避免传统机译中“一词多译”“张冠李戴”等现象。
彩云科技CEO袁行远解释说,人工智能在翻译时,会从原文中提取出人物并判断其性别。它在判断什么词是人名时,会依据一些语法规则,例如“××说”,“说”字前的名词一般是一个人。利用类似的方式,人工智能就能获得一张专有词表,使得翻译工作得以顺利推进。另一方面,过去常见的“逐句翻译”常常忽略语境,导致翻译结果僵硬、不知所云,而目前的机器翻译已经发展到“理解上下文”的程度。
不过,这只是技术上的进步,精准翻译具备了可能性,还无法进行规模化应用。业内人士指出,比较浅白的表述,AI可以“猜”出正确的翻译,但遇到比较迂回的表述,比如语料中从未出现过的成语,AI猜错的可能性就会变大。例如,“燃灯如豆”可能被直译成“火焰像豆子”,机器无法理解深层的内涵。同时,它也不能理解故事的复杂逻辑,无法判断前面一个伏笔会成为故事后面至关重要的因素,这都是尚需进一步探索的课题。
人工智能翻译还离不开人的“精加工”
是否使用人工智能翻译,不同的作家学者也有不同的理解。
|