谷歌翻译的几种典型错误

谷歌翻译一直是机器翻译领域的领头羊,但蹊跷的是在谷歌翻译的翻译结果中,竟然会出现一些典型的低级错误。

但是这些错误之所以没有被解决,也许恰恰体现出谷歌翻译的某种优势,即谷歌更重视和擅长对语义的理解和翻译,而非形式上的自然和通顺。这一点要超过其他一些机器翻译软件以及很多人工翻译。

很多人工翻译为了保持译文的自然通顺,不惜省略掉原文中的一些重要词汇和含义。这样一来原文看起来很漂亮,但实际上还不如谷歌翻译那样更能完整地表达出原文的含义。

我这里不是想对机器翻译和人工翻译出优劣进行评价,只是顺便谈谈谷歌翻译和人工翻译各自的一些优点和缺点。

以下列举了几种谷歌翻译中经常存在的一些问题,也许对某些机译编辑项目(如果使用谷歌翻译)和其他相关项目(如机器翻译软件开发)有帮助。

1. 顿号的缺失

目前谷歌翻译的译文中没有中文常见的顿号,英文中的逗号统一转换成中文逗号。对于并列的中文短语来说,这是一个问题。

2. “著名”写成“着名”

这是一个更加低级的错误,谷歌似乎不知道怎么正确地写出“著名”,而是统一以“着名”代替。当然这个错误不仔细看也不容易发现,也不影响对译文的理解。

3. “被”字的滥用

对“被”字的滥用就涉及到我在文首提到的谷歌对语义翻译的重视。谷歌翻译的工程师们不可能不知道,汉语中的被动句式远少于英文。但是在谷歌翻译中,英文中的被动句式往往还是直译为包含“被”字的中文。

这样翻译当然不影响理解,但是对很多句子来说,采用被动句式读起来是很别扭的。但即便是对人工翻译来说,很多句子的“变被动为主动”,也不是一件容易的事儿。

所以谷歌翻译干脆也就不进行这种转换了。这样做的好处是至少保留了原本的语义,还不是像某些人工译员那样,对一些难句长句进行删减甚至曲解,以求形式上的自然通顺,好跟翻译公司或客户交差。

4. 逐词翻译

和其他所有机器翻译软件一样,目前谷歌翻译也存在着逐词翻译(word-for-word translation)的问题。

我想对于机器翻译来说,这个问题在短期内是无法解决的。但同样是逐词翻译,谷歌翻译总体上比其他机器翻译软件更能准确“理解”和翻译原文的含义,这也对体现出谷歌翻译在语义理解方面的优势。

以上就是我总结的谷歌翻译中目前存在的4种典型的错误和问题。相比其他公司,谷歌无可比拟地坐拥庞大数据,但是在人工翻译数据的掌握这一块似乎还不如大型翻译公司,包括提供人工翻译服务的有道。毕竟,很少会有译员在谷歌翻译的页面上反馈翻译错误吧。