最近有Reddit用户发现,在谷歌翻译中输入“dog”19次,选择从毛利语翻译成英语,然后就会弹出一段非常诡异的宗教预言。

18个“dog”,增加了“increasingly”(预言最终版不需要19个)

在Facebook“失控”的AI发展出人类无法理解的语言之后,或许我们又发现了AI在暗地里通讯的另一种模式。。。

例如,在索马里,“ag”这个词的字符串可以转化为圣经中“Gershon的儿子”,上帝“耶和华的名字”,并提到了圣经术语如cubits和Deuteronomy。

名为TranslateGate的reddit用户推测,这可能是谷歌翻译从收集的电子邮件或私人信息的文本中提取到的一些奇怪的输出。

谷歌发言人贾斯汀.伯尔在一封电子邮件中表示:“谷歌翻译从网络翻译的例子中学习,不使用邮件或私信进行翻译,系统甚至也无法访问该内容。这些奇怪的翻译可能是因为系统获取了无意义输入,然后产生了无意义的输出。”

例如,可能是谷歌员工的恶作剧,或者某些用户滥用“提出修改建议”按钮,把这些文字赋予了某些无意义的输入信息。

哈佛大学助理教授,研究自然语言处理和计算机翻译的亚历山大.拉什表示,内部质量过滤器可能会捕捉到这种类型的操纵。更有可能的是,奇怪的翻译与谷歌翻译几年前所做的改变有关,当时它开始使用一种称为“神经机器翻译”的技术(neural machine translation)。

在神经机器翻译中,系统使用一种语言的大量文本和另一种语言的对应翻译进行训练,以创建两者之间的匹配模型。但是,当它接收无意义输入时,系统可能会产生“幻觉”,出现一些奇怪的输出。

“我们提供训练材料,然后希望机器学会某些功能。至于机器如何通过这些训练材料学会这些技能,其中的某些部分我们还不是十分清楚。”

BBN Technologies从事机器翻译工作的高级科学家肖恩·科尔巴斯(Sean Colbath)认为奇怪的输出可能是由于谷歌翻译的算法在接受无意义输入时,尽量给出合理的答案。

他还指出,产生最奇怪结果的语言——索马里语,夏威夷语和毛利语,它们比英语、中文等使用更广泛的语言具有更小的翻译文本(即可用于训练的材料很少)。

因此,谷歌可能会使用像圣经这样被翻译成多种语言的宗教文本作为小语种的训练内容,因此产生了一些奇怪的宗教翻译。

但真是如此吗?再看下面这个,对于加了不少空格,把“why are the translations so weird”打乱的输入,谷歌翻译给出的结果是这样的:

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注