机器翻译新突破，微软中英新闻翻译达人类水平

发布时间：2018-03-15 浏览数：

翻译没有唯一标准答案，它更像一种艺术。

AI科技评论消息：14日晚，微软亚洲研究院与雷德蒙研究院的研究人员宣布，其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上，达到了可与人工翻译媲美的水平；这是首个在新闻报道的翻译质量和准确率上可以比肩人工翻译的翻译系统。

newstest2017测试集由来自产业界和学术界的团队共同开发完成，并于2017年在WMT17大会上发布。而新闻（news）测试集则是三类翻译测试集中的一个，其他两类为生物医学（biomedical）和多模式（multimodal）。

四大技术

我们知道，对于同一个意思人类可以用不同的句子来表达，因此翻译并没有标准答案，即使是两位专业的翻译人员对于完全相同的句子也会有略微不同的翻译，而且两个人的翻译都不错。微软亚洲研究院副院长、自然语言计算组负责人周明表示：“这也是为什么机器翻译比纯粹的模式识别任务复杂得多，人们可能用不同的词语来表达完全相同的意思，但未必能准确判断哪一个更好。”

这也是为什么科研人员在机器翻译上攻坚了数十年，甚至曾经很多人都认为机器翻译永远不可能达到人类翻译的水平。近两年随着深度神经网络的引入，机器翻译的表现取得了很多显著的提升，翻译结果相较于以往的统计机器翻译结果更加的自然流畅。

据了解，在这次的工作中来自微软亚洲研究院和雷德蒙研究院的三个研究组通过多次交流合作，将他们的研究工作相结合，再次更进一步地提高了机器翻译的质量，其中用到的技术包括对偶学习（Dual Learning）、推敲网络（Deliberation Networks）、联合训练（Joint Training）和一致性规范（Agreement Regularization）等。

对偶无监督学习框架

对偶学习，即利用任务的对偶结构来进行学习。例如，在翻译领域，我们关心从英文翻译到中文，也同样关心从中文翻译回英文。由于存在这样的对偶结构，两个任务可以互相提供反馈信息，而这些反馈信息可以用来训练深度学习模型。也就是说，即便没有人为标注的数据，有了对偶结构也可以做深度学习。另一方面，两个对偶任务可以互相充当对方的环境，这样就不必与真实的环境做交互，两个对偶任务之间的交互就可以产生有效的反馈信号。因此，充分地利用对偶结构，就有望解决深度学习和增强学习的瓶颈——训练数据从哪里来、与环境的交互怎么持续进行等问题。

推敲网络的解码过程

推敲网络中的“推敲”二字可以认为是来源于人类阅读、写文章以及做其他任务时候的一种行为方式，即任务完成之后，并不当即终止，而是会反复推敲。微软亚洲研究院机器学习组将这个过程沿用到了机器学习中。推敲网络具有两段解码器，其中第一阶段解码器用于解码生成原始序列，第二阶段解码器通过推敲的过程打磨和润色原始语句。后者了解全局信息，在机器翻译中看，它可以基于第一阶段生成的语句，产生更好的翻译结果。

联合训练：从源语言到目标语言翻译（Source to Target）P(y|x) 与从目标语言到源语言翻译（Target to Source）P(x|y)

联合训练可以认为是从源语言到目标语言翻译（Source to Target）的学习与从目标语言到源语言翻译（Target to Source）的学习的结合。中英翻译和英中翻译都使用初始并行数据来训练，在每次训练的迭代过程中，中英翻译系统将中文句子翻译成英文句子，从而获得新的句对，而该句对又可以反过来补充到英中翻译系统的数据集中。同理，这个过程也可以反向进行。这样双向融合不仅使得两个系统的训练数据集大大增加，而且准确率也大幅提高。