品玩

科技创新者的每日必读

打开APP
关闭
Google

我用一些经典段落试了试新版 Google 翻译,发现…

优秀的语言翻译仍然是手艺活儿。

xyzhang

发布于 2016年10月2日

9 月 27 日,Google 发布了神经机器翻译系统(GNMT:Google Neural Machine Translation),并且将 GNMT 投入到了难度系数颇高的汉语-英语翻译应用中,准确率得到了相当程度的提升,英语专业的群众纷纷表示遭遇了一次重大的失业危机。

Google Research Blog 上的相关文章指出,GNMT 使用了当前最先进的训练技术,能够实现到目前为止机器翻译质量的最大提升。

图表显示,在这几种翻译模式中,汉译英是最难的。

尽管机器越来越聪明,但也有研究翻译的人类代表站了出来。经常活跃于社交媒体上“翻译”话题的华东师范大学比较文学教授金雯(ID:莫水田)撰文指出:

谷歌中译英对写得像英文的中文句子比较能应对自如,就是那些主语谓语宾语等成分清晰的句子。尤其惊艳的是对于包含两三个短句,当中用逗号连接,逻辑关系清晰(即西化)的中文句子,谷歌翻译能够正确识别何为主句,何为表达因果、伴随状态的状语从句。当然,对许多四字成语和俗语(如“梁上君子”、“图样图森破”等)也有备而来,至少在单独出现的时候能够识别并正确翻译。

这也就是说,谷歌中译英比较适用于一板一眼的中文,比如写得干涩而又十分清晰的科学论文和人文社科类论文(即便是这类论文,也会出现机器无法处理的长难句),或许也适用于一部分新闻社论。这类中文用谷歌翻译成英文后,经人工修改把关,问题就不大了。这样的确可以节省许多初级、机械的翻译人工,对翻译生产力是一种解放。至于会不会引发大量翻译失业的问题,还不能就此作出判断。

然而,谷歌中译英对于大部分散文作品、日常电邮交流(可能有官话,可能有省略式表达)、口语化的生动表达、诗词曲艺、文字游戏等,都还只能望洋兴叹。而且,我发现,即使是谷歌认识的短句式和俗语,出现在有些复杂蜿蜒的句子中时,也会让谷歌犯迷糊。

中文与英文也有许多不兼容的地方,有自己独特而狡黠的语法。况且,自然语言是灵动的,不论中英文,写的灵动的时候都是不机械,不容易理解的。对语言的灵动,机器目前是无能为力的,不知未来如何。还是希望研究语言文学的人与科技界人士多多交流互补,虽然主力军还是人工智能人士。

有的人说,为了使用谷歌翻译,可以将自己的中文句子写成机器可以辨认的样子。这个技巧当然是没错的,为了论文能够顺利快速地翻译成英文,也不失为一个权宜之计。可是这项技术不应该是为人服务的吗?  如果让自然语言削足适履,科技就真的变成禁锢人类语言才华的枷锁了。

有的同学就拿文言文去调戏 Google 汉译英,但这种“松下问童子”式的机巧并不能令人满足。

因此,我选择把一些大家熟知的著名段落交给 GNMT,进行中英对比。这些段落难易有别,有的原著是英文,有的是汉语,有的是二者之外的其它语言,还有的曾通过英汉翻译,经过了不同译者之手。它们不能作为严谨的语言学研究素材,至少可以得出一个结论——优秀的翻译仍然是手艺活儿。

1、段落节选自《百年孤独》,原文西班牙语,作者加西亚·马尔克斯

英语版本,译者 Gregory Rabassa:

Many years later, as he faced the firing squad, Colonel Aureliano Buendía was to remember that distant afternoon when his father took him to discover ice.

汉语版本,译者范晔:

多年以后,面对行刑队,奥里雷亚诺.布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。

这是《百年孤独》的经典开头,几个汉语译本差别不大,这里就考考 Google 对汉语版本的翻译:

Years later, in the face of the firing squad, Colonel Orijano Buendia recalls the distant afternoon when his father took him to see the ice.

基本上准确率还是不错的。

2、段落节选自《了不起的盖茨比》,原文英语,作者菲茨杰拉德

英语版本:

In my younger and more vulnerable years my father gave me some advice that I've been turning over in my mind ever since.

"Whenever you feel like criticizing anyone,"he told me,"just remember that all the people in this world haven't had the advantages that you've had."

汉语版本,译者巫宁坤:

我年纪还轻,阅历不深的时候,我父亲教导过我一句话,我至今还念念不忘。

“每逢你想要批评任何人的时候,”他对我说,“你就记住,这个世界上所有的人,并不是个个都有过你那些优越条件。”

这是另一个著名的开头,就词句本身来说也很简单,由于原文就是英语,这次就让 Google 来做英译中的工作:

在我更年轻,更容易年,我的父亲给了我一些建议,我一直在我心中从此翻身。

“每当你觉得批评任何人,”他告诉我,“只记得,所有的在这个世界上的人都没有,你有过的优势。”

前半句的错误还是非常明显,失去了一些字词,也没能翻译出愿意;后半句基本能让人明白,但仍然称不上通顺。

3、段落节选自《万寿寺》,原文汉语,作者王小波

汉语版本:

莫迪阿诺在《暗店街》里写道:“我的过去一片朦胧……”这本书就放在窗台上,是本小册子,黑黄两色的封面,纸很糙,清晨微红色的阳光正照在它身上。

英文《万寿寺》本身就是非常好的中文小说,我们就直接把 Google 请出来:

"My past is hazy ..." the book was placed on the windowsill, this brochure, black and yellow cover, the paper is very rough, early morning micro The red sun was shining on it.

不知道为什么,Google 省略掉了莫迪阿诺和《暗店街》,“清晨微红色的阳光正照在它身上”这半句也没能翻译出。

4、段落节选自《论十大关系》,原文汉语,作者毛泽东

汉语版本:

什么是国内外的积极因素?在国内,工人和农民是基本力量。中间势力是可以争取的力量。反动势力虽是一种消极因素,但是我们仍然要作好工作,尽量争取化消极因素为积极因素。在国际上,一切可以团结的力量都要团结,不中立的可以争取为中立,反动的也可以分化和利用。总之,我们要调动一切直接的和间接的力量,为把我国建设成为一个强大的社会主义国家而奋斗。

也直接请出 Google:

What are the positive factors at home and abroad? In the country, workers and peasants are the basic forces. The middle forces are the forces that can be striven. Although reactionary forces are a negative factor, we still have to do our best to try to turn negative factors into positive factors. In the international arena, all forces that can be united must be united, neutrality can be striven for neutrality, reaction can be divided and utilized. In short, we must mobilize all direct and indirect forces, to build our country into a strong socialist country and struggle.

由于《论十大关系》最初就是一份会议讲话,因此文本更口语化,只要理解其中的概念,基本上是很易懂的,所以不论是语法还是字词都显得翻译通顺了许多。。

下载品玩App,比99.9%的人更先知道关于「Google」的新故事

下载品玩App

比99.9%的人更先知道关于「Google」的新故事

iOS版本 Android版本
立即下载
xyzhang

这家伙很懒,什么也没留下,却只想留下你!

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测