返回首页
当前位置: 首页 > 澳门皇冠国际

突破!看限定性神经网络如何让翻译更精准!

时间:2019-01-27 05:37:32来源:本站 作者: 点击:
  

  澳门皇冠国际2018年6月17杭州语言服务世界杯,出现一种“很吓人”的技术,能够瞬间切换世界杯各个国家的语言,那速度那精准度,堪比场上的“C罗”!

  近日在杭州举办的语言服务行业国际研讨会上,新译科技田亮博士分享了一种新的机器翻译技术——限定性神经网络技术,正好能满足世界杯那么多术语翻译需求。

  如果能用这个神器,一边看球一边精准的用各国专业足球术语,在社交媒体上发言、吐槽、晒见识,你会不会瞬间成为朋友圈里的“C罗”?

  你一定看过有些机械翻译的稿子,简直就不在“说人话”。莫名的译文、头痛的数字、关键术语的翻译错误,我们还能愉快地玩耍嘛?

  翻译是艺术和技术的完美结合。机器翻译从上世纪四十年代开始至今,经历了基于规则的、实例的、统计的和神经网络算法的几个过程。

  今日,神经网络算法正处于不断完善过程中。它比起传统的统计机器翻译,译文质量有极大提高,不过,一旦涉及到术语等关键信息,译文往往是这样的:

  在翻译的过程中,包括口译和笔译,如果把一句话中的关键信息(主从关系、数字、日期、人名、地名、机构名、货币等)表达出来,就能基本达到沟通的目的。如果把原文中的关键词(算法工程师称其为:命名实体)替换成想要的准确译文,不就能实现准确翻译的目的吗

  小编也从事翻译十几年,曾几何时也是这么想的,因为以前就这样做的。但是不知何时起,这种“聪明的”技巧,已经在主流机器翻译中不起作用了。

  只需要把“澳门皇冠假日酒店”替换成我准备的术语“Crowne Plaza Macau”,就大功告成,稍作修改就得到我想要的译文:

  文科生小编把脑袋想爆炸了之后,终于明白,在传统基于短语的统计机器翻译等系统中,可以简单地把数字或者专有名词,原封不动复制到翻译句子中,但在神经网络机器翻译中,这样的操作无法有效进行。

  真正的规则系统始于上世纪70年代。规则的原理很简单,最初就直观地认为,找很多语言学家,集中写一些语法规则,并辅助一些双语词典和转写规则就能实现精准翻译。

  在一些特定的场景,如天气预报、时间预测等,规则系统在形态的准确性、结果的可复现性、针对特定领域进行调整的能力还是非常强的,但是要创造一个理想的基于规则的系统,就算让语言学家尽力穷尽一切拼写规则来增强它,也总会遇到例外。英语有不规则动词、德语有可分离前缀、俄语有不规则的后缀,在人们说话的时候又会有各自的特点,别忘了有些词根据上下文还会产生不同的意思。

  后来,基于语料库的方法走上舞台。1981年,日本的长尾真教授首先提出了这种思路:直接用已经准备好的短语,不用重复翻译。

  这种方法,在现有的平行语料库中找出与待翻译部分最相似的翻译实例,再对实例的译文通过替换、删除或者增加等系列操作,实现翻译。相似的例句越多,翻译的效果越好。

  它的缺点是,系统性能依赖于语料库,数据稀疏问题严重,语料库中不容易活动大颗粒度的高概括性知识。

  这种方法,将两种语言中同义的句子切分成词进行匹配,然后去计算某些片段会翻译成多少种可能,最后统计出来频率高的,就认为正确译文的可能性较大。

  2006年,基于统计的机器翻译方法开始普及。Google翻译、Yandex、微软必应等在线翻译工具都用上了基于短语的机器翻译。直到2016年,它都被视为最先进的机器翻译方法。

  我们给机器更多的文本,它就给我们更好的翻译。但是!!设定的各种特征值,以及需要N多种自然语言处理的技术(分词、词性标注、句法分析等),每一步的错误率,像滚雪球一样,将导致最终的结果有很大偏差。而且最大的问题是调序模型的不完善,覆盖不到全局特征,导致统计机器翻译一直阅读的流畅性不是很好。

  神经网络机器翻译(Neural Machine Translation, NMT)相比于传统的统计机器翻译(SMT)而言,能够训练一张可以从一个序列映射到另一个序列的神经网络,输出的可以是一个变长的序列,这在翻译、对话和文字概括方面能够获得非常好的表现。

  这个大神,简直有点像媒婆!想象媒婆在给A介绍对象B的场景,突破!看限定性神经网络如何让翻译更精准!A(原文)虽然没有见过B(译文),但是只要媒婆能够大致的描述B的特征(包括身高、长相、身材、年龄等),A就能根据这些描述大致勾勒出这个目标恋人B(译文)的样子。

  两年来,神经网络超过了翻译界过去几十年的一切。神经翻译的单词错误减少了50%,词汇错误减少17%,语法错误减少19%。

  我们了解到,神经网络训练像个“黑盒子”,丢一个东西进去, 它会给你丢出来另一个东西,丢出和丢进的东西有某些联系。但黑盒里究竟发生了什么?由于不清楚这个黑盒子的运作原理,传统的干预手段,在神经网络机器翻译中效果不那么明显。

  限定性神经网络的初衷就是通过干预输入的句子,然后让底层神经网络的模型参数进行调整,并准确无误的还原干预部分的译文表达。

  不少国内外机构使用认识心理学解释深度神经网络这个黑盒子,而限定性神经网络,就是借助这类原理干预了底层。

  限定性神经网络的初衷就是通过干预输入的句子,调整底层神经网络的模型参数,并准确无误的还原干预部分的译文表达。

  我限定了这个

来顶一下
近回首页
返回首页
------分隔线----------------------------
发表评论 共有条评论
栏目最新
热点内容
相关内容
    无相关信息