「机器翻译」神经机器翻译的新功能

2018-08-17 08:41:14

我最近参加了TAUS东京峰会，其中神经机器翻译（NMT）是一个热门话题。正如谷歌的Macduff Hughes所说的那样“神经机器翻译在2016年就是一个谣言。六个月前发生的第一批测试和测试已经发生，现在已经到了。”

尽管做出承诺还为时尚早，但翻译行业足够聪明，不会再次过度承诺。在“统计机器翻译热”的时代，我一直在风暴的眼中，我很清楚结果是非常有希望的，但没有MT专业人员会告诉我们技术将在哪里引领我们。

自2007年以来，机器翻译公司已经建立了基于相关语言对的纯统计机器翻译的复杂平台，或者当涉及的语言对几乎没有语法关系时建立混合（基于规则和SMT）。当语法结构过于不同时，控制输入并使其更适合机器学习并且可预测，这似乎是建立统计模式的关键。使用基于规则的技术，形态丰富的语言总是表现得更好。统计数据用于平滑最后一句。

什么是人工神经网络？

简而言之，人工神经网络（ANN）是一种处理信息的范例，它可以让我们思考我们自己的生物神经系统（相互关联的决策中心参与并权衡决策）。这个（不是新的）范例的关键要素是信息处理系统的结构，在人类的情况下，它由大量高度互连的处理元素组成，我们称之为神经元。

让我们记住，不仅人类有能力做出决定。基于直觉，许多哺乳动物可以体验我们称之为“一种智能”的东西。神经元协同工作以解决特定问题。人工神经网络通过实例学习，就像我们一样。为此，他们需要样本，即数据，大量数据。

神经网络可以配置为学习很多东西，而不仅仅是两种语言（两个系统）之间的双语模式。它还可以用于任何类型的模式识别（例如手写）或数据分类（图片，对象，形状等）。

神经网络需要学习过程，之后它可以创建相当准确的查询表示。以人（或哺乳动物）为例，生物系统需要调整神经元之间存在的突触连接 - 这也发生在人工网络中。

神经网络不能创造奇迹。但如果使用得当，它们可以产生一些惊人的效果。

神经机器翻译炒作的开始？

我们可能认为这一切都始于 Google神经机器翻译团队的帖子。看起来他们终于破解了语言障碍，输出 令人惊讶的人性化。

事实上，神经网络在过去的30年里一直存在于学术界（我将推荐1997年由卡斯特利翁Jaume I大学和西班牙瓦伦西亚大学的Casta?o＆Casacuberta撰写的一篇鼓舞人心的论文，名为“使用神经网络进行机器翻译”有限状态模型“）。

但即便更早，早在1943年，第一个人工神经元就由神经生理学家沃伦·麦卡洛克的逻辑学家沃尔特·皮茨制作。但是，当时可用的技术不允许它们做很多事情。多年来，神经技术声名狼借，缺乏资金。

对统计技术和数据处理的研究使人们对神经系统以及GPU的可用性产生了新的兴趣。神经网络使用游戏玩家使用的相同类型的图形卡进行训练，并且有一个简单而充分的理由：这些卡在执行数学计算时非常有效（对于游戏来说，它是图像的渲染）。神经网络都是关于数学的。而CPU必须负责一般的监控任务，如控制硬盘，与主板连接，控制温度，访问RAM等，GPU卡只能进行数学和数学运算，其结果是质量图形。在用于机器翻译的神经网络的情况下，游戏和质量输出。

谷歌的初步结果 - 由一群专业翻译和爱好者在线检查 - 引发了围绕新神经机器翻译产生高质量翻译能力的一系列对话。输出的语言上的震撼令人印象深刻，随后出现了提及“神经”的学术出版物，以及Facebook最近宣布卷积NMT可以快9倍并产生更好的结果。

新的流行语是神经网络，关于人工智能的炒作只能增长。事实上，我们不知道新技术何时何地可以带给我们。我们在LocWorld 2011上的演示文稿中的这张图表将很容易地说明我们的起点。该演示文稿是我们的一位客户Sybase的一份报告，其中包括当时数据量相当低的英德SMT引擎，500万字。

然而，炒作是很自然的，因为一般来说机器翻译的可接受程度较高，结果质量较高。

「机器翻译」神经机器翻译的新功能