正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2018-09-13 11:11

一分钟了解机器翻译

作为比“人工智能”这个词诞生得还早的 NLP 任务,机器翻译经历了怎样的发展?本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。



机器翻译(Machine Translation),又叫自动翻译,是指利用计算机将一种自然语言转换为另一种自然语言的过程。


作为比人工智能这个词诞生的还早的自然语言处理任务(1954),机器翻译经历了漫长的发展过程,大致可以分为三个阶段。



第一个阶段是基于规则的翻译方法(RMT)。与人类类似,这种方法会先分析句子中单词的词性,将每个词翻译成目标语言,再根据语法规则等进行调整,输出结果。


可想而知,这种翻译方法效果并不好,因为语言表达的方法非常灵活,有限的语法和规则无法覆盖所有的语言现象。



第二个阶段是基于统计的翻译方法(SMT)。即根据词或短语找到所有可能的结果,再在庞大的语料库中进行搜索,统计每种结果出现的概率,将概率最高的结果进行输出。


这种方法较规则方法效果有很大提升,不过对语料库的依赖较大。



第三个阶段是基于神经网络的翻译方法(NMT),通过学习大量成对的语料(平行语料库)让神经网络自己学习语言的特征,找到输入和输出的关系,端到端的输出翻译结果,取得了不错的效果。


不过这些方法并不是非此即彼的。比如在成对语料较少的语言之间,用统计方法效果比较好;或者干脆没多少语料,就要靠中间语言进行转换;有些约定俗成的成语短语,用基于实例的翻译方法能更好的解决。




现在的机器翻译系统,基本上会将几种方法的优点进行融合,不过距离翻译的标准——信、达、雅,还有很远距离。


本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

别打CALL,打钱

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: