首页 /

翻译技术越来越好对未来意味着什么

   发布时间:2018/9/20 16:43:55

多年来,我认为翻译的趋势越来越多,从基于规则的知识为基础的方法转向学习方法。系统现在已经真正达到了非常好的准确性,所以我认为,在我们的一生中,我是相当肯定我们会达到 - 如果我们还没有这样做 - 人类级别的表现,和/或超过它。

“当前真正让社区风靡全球的技术当然是神经机器翻译。它基本上只需要整个社区采用它一年,主要是因为统计翻译的性能提升非常非常好。在此之前,统计翻译从基于规则的方法中取代,并且随着每一次跳跃,我会说主要的好处是更多的事情基本上是通过学习来完成的,而不是制定建模假设或规则。“

关于神经机器翻译和统计翻译等术语

“首先,当人们进行基于规则的翻译时,他们会尝试通过语言规则来做所有事情。然后你要做的就是创建规则来解释句子的上下文,以便你可以选择正确的单词。输出语言。假设我使用“银行”这个词,那么我们是在谈论河岸吗?还是我们在谈论金融机构?答案是它真的取决于背景。过去,人们做过这是通过规则,通过使用复杂的句法分析器,通过使用大型词典和本体来解释世界的语义。但正如你和我所知,那当然总是导致这些笑话和这些有趣的翻译系统根本不了解我们所拥有的一些语义差异。

“机器翻译中最大的问题始终是模棱两可。我们只是不知道一个词是什么意思 - 如果你说,'如果宝宝不喜欢牛奶,煮沸它,'你的意思是煮牛奶,或者煮沸宝宝?我们都知道我们的意思是煮牛奶,但那是因为我们知道我们不煮沸宝宝,对吧?但是如果你现在把它翻译成德语,那么你需要知道你的意思是哪一个,因为它然后我们可以提到婴儿或牛奶。所以我们真的必须解决这些问题,通过规则这样做本质上是一项艰巨的任务,人们最终放弃了,因为你不能简单地描述我们在学习过程中学到的所有事实。通过编程规则的生命。“

“历史上真正的下一个层次是去统计机器翻译,这些东西通过基本计算得到了缓解。这项技术很容易解释,因为你有效地创建了一个字典,而且字典有多个翻译,所以'银行'将是金融机构,你还有另一个词,河岸,然后你分配概率。我说的是河岸或金融机构的可能性有多大?只是单词本身。然后是然后,统计模型也会考虑上下文,你也可以简单地从大量数据中获取。世界上的谷歌显然拥有大量的数据,因此通过获取大量的文本数据,你可以计算出多长时间的数据。银行'翻译为金融机构,如果你有“德意志银行”的背景,德意志银行,如果我说“密西西比”和河岸,你会谈到河岸吗?

关于神经机器翻译的进展

“你会说,有效的神经机器翻译也是一种统计学习。然而,它通过多层抽象来实现这一点。所以这就是'深'这个词的来源,因为你有几层构建在顶层的神经元对你来说,这是一种在语言,言语和视觉方面不同层面抽象的方式,而我们却没有明确地告诉它。“

如果这项技术最终能够使人们不必学习其他语言

“我们经常提出这个问题,但实际上我碰巧有点逆势而已,我认为这将是相反的。因为我认为自动翻译对我们来说对人类来说是真正开放的。所以我们结束了实际上是去国家旅行或会见那些我们原本从未见过或从未与之交往过的人。

“所以我觉得把技术作为开门人的感觉,实际上会帮助我们与说其他语言的人建立更多联系,只因为它很好,它开启了我们的世界,我们开始更多地了解彼此,这就是当然是什么。“

Copyright © 2003-2019 All Rights Reserved. 北京联合乐文翻译有限公司 京ICP备17046879号-1