当AI写出很好的文章，机器翻译也在日益完善

开国元帅林彪劝老婆少说话，大意是：“如果你说的别人知道，你等于白说；如果你说的别人不知道，你说了也没用。”

我在高中时就有这样的困扰，我时常觉得身边的同龄人说的话都像是某种机械的反应，比如A对B说了某句话或者作出某种举动，B就一定会回应某句话，甚至连表情都大差不离，感觉就像是设计好的台词。如果是这样，说那些话还有什么劲呢？

我们看一些比较老套的影视剧时也会这样的感觉，能猜到某个角色下面会说什么。

我想，类似这样的现象都可以从侧面证明，人的表达有很大的规律性和重复性，你说的每一句话可能都在全世界被不断重复着。而这大概也就是为什么人工智能能模仿人类进行写作。

最近看了一篇文章就提到，知名杂志《纽约客》的作者来到OpenAI的总部，亲自对全能版的人工智能写手进行了测试。他给GPT-2布置的任务是，学会像《纽约客》杂志的记者一样写作。

Open AI的CTO Greg Brockman，用GPT-2的全能版处理了《纽约客》杂志从2007年开始到今天全部的非虚构文章，还让机器阅读了一些20世纪60年代的经典文章。

根据这些数据，GPT-2把《纽约客》的文章特征进行了分门别类，比如记者喜欢用哪些词汇，用什么样的叙事性的修辞，文章行文的节奏什么样，等等。通过这些分析，算法对GPT-2进行了“调准”。

然后，作者让GPT-2写一篇海明威的人物特写。开头，是《纽约客》的真人记者在1950年对海明威的一篇著名访谈。原文是这样的，我翻译过来，给你念一下：

“海明威可能是当时美国最伟大的小说家和短篇作家。他很少来纽约。大部分时间他都在距离哈瓦那9英里外的农场度过，那个农场叫做瞭望山庄。在那生活的除了他和妻子之外，还有9个佣人、52只猫、16只狗、几百只鸽子和3头奶牛。”

这是开头。然后，就交给算法了，让算法以记者的视角，补充下一段。算法是怎么写的呢？我给你念念：

“我（也就是记者）沿着小路向篱笆走去，看见了一只胖乎乎的狗。这只狗在战前经常来瞭望山庄，它现在正沿着小路飞奔到主楼，旁边还站着一头同名的、微小的母牛。院子的地上有一摊红肉汁，海明威就在草坪的椅子上坐着。”

这么一听是不是觉得，这写的也太好了吧？连作者都说，他看到这段的时候，感觉仿佛是自己在写作一样，人工智能的写作能力让他大吃一惊。

如果人工智能能把写作做到这个程度，那么翻译自然也就不在话下了。前段时间审核一个MTPE的稿子，发现机器翻译居然自动把某个品牌名称翻译成其官方中文名称，并且自动在后面加上一个括号，里面放上了英文名称。这个格式简直和细心负责的人工翻译做出来的效果一模一样。

当然，人工智能的算法并不能像人类一样真正“理解”文字，它只是根据海量的数据总结出一些规律，而这个做法则几乎和人工翻译平常所做的如出一辙。

我们人工译员虽然能理解源语言和目标语言，但怎么在两种语言之间进行切换，我们更多地并非在是创造，而只是根据一些即有的规律进行转换而已。

很多人会说，机器翻译永远都不会取代人工翻译。这句话既对也不对。机器翻译只会越来越强，人类对机器翻译的文体也会越来越接受。

但机器翻译能否最终完全取代人工翻译，暂时也看不到这一天。所以目前的机器翻译仍然只是根据规律性的东西进行语言转换，这一点和基础的人工翻译流程一样，只是耗时要少得多。

所以把这种基础的转换交给机器去做，我想不出一个优秀的译员有什么理由不对此感到欢欣鼓舞。当机器翻译把基础性工作做完，人工译员才能花费更多时间进行更有意义的下一步，也就是进一步提升译文水平。

发表回复 取消回复

发表回复取消回复