AI翻译服务通过硬件、软件连接千千万万个应用场景,会打破语言不通的尴尬局面吗?会是人工翻译的终结者吗?

世界这么大,我想去看看!十一长假临近,梦想中的你背起行囊,自由行走在异国的大街小巷。然而现实的画风很有可能是这样的:走出国门没几天,你就发现期待已久的旅行,因为看不懂听不懂,而身在囧途。此时的你捶胸顿足地感慨道:世界上最遥远的距离,不是天涯海角,是你站在我面前,我却不知道你在说什么。

9月21日,百度智能翻译机在日本发布。名古屋有哪些好玩的景点?怎么乘车最便捷?翻译机流畅精准的中日互译令人惊叹不已。AI翻译服务通过硬件、软件连接千千万万个应用场景,将会打破语言不通的尴尬局面。甚至有人认为,AI翻译是人工翻译的终结者。现实真的如此吗?

现状:产品虽多,准确率有待提高

2017年可谓是AI大行其道的一年,作为现代科技的流行趋势,不管是谷歌、苹果,还是百度、阿里,都在相继发布自己的人工智能产品,向智能行业进军。而AI翻译,几乎是所有互联网巨头都想涉足的领域。

机器翻译已出现了70年,但过去一年里涌现出的AI翻译软硬件产品,已超过最近30年的总和。

在国外,微软发布了翻译工具Microsoft Translator,可以实现9种语言实时语音转为文本翻译。国内的互联网巨头也不甘示弱。百度技术委员会联席主席、自然语言处理部技术负责人吴华表示,百度翻译支持全球28种语言互译、756个翻译方向,每日响应过亿次的翻译请求。除百度外,科大讯飞也走在语音交互前列,推出了讯飞听见升级版产品,加入多语种翻译功能,五种语言同步翻译成汉语,还发布了智能翻译产品“晓译翻译机”。就连网络游戏开发大户腾讯公司,也悄然上线了一款实时语音翻译APP“翻译君”,这款以AI内核驱动的翻译产品,运用了语音识别+NMT(神经网络机器翻译)等技术,可以实现“同声传译”功能,对着屏幕说话时,边说边翻,就像身边带了一位私人翻译官。此外,电商大咖京东也开始涉足AI翻译,推出了一个可以进行多国语言实时翻译的人工智能翻译机——准儿翻译机的众筹项目,目前已经有5008名支持者,轻松筹得320万元的项目基金。

尽管AI翻译进步神速,却不被传统的翻译行业所看好。传神语联网络科技股份有限公司董事长何恩培表示:“无论是翻译机还是APP,中文翻译成英文或其他语种时准确率还可以,但外国人说英文或其他语言时,翻译成中文的准确率就很低,在实际交流时几乎没法用。”

今年2月,谷歌全新NMT系统在韩国世宗大学与人类译员进行的翻译对战就是一例佐证。在规定的50分钟内,人类和机器同时翻译两段随机文本。结果,人类以巨大优势战胜了机器。赛后,评委表示,NMT系统翻译出的文本90%都有语法问题。

难点:数据有限,且语言规则不规律

全球范围内,服务于各大跨国会议、发布会等的30多种翻译机能帮人们解决一些场景中语言交流的问题,但目前的现状就如科大讯飞声明的那样:虽然机器翻译已经取得非常大的进步,但距离高水平翻译所讲究的“信、达、雅”还存在很大差距。

以“千山鸟飞绝,万径人踪灭”这句人们耳熟能详的诗为例,国际翻译界最高奖项之一“北极光”杰出文学翻译奖得主许渊冲教授将其译为“from hill to hill no bird in flight,from path to path no man in sight.”这不仅符合近代著名翻译家严复提出的“信、达、雅”翻译原则,而且其中的意境与精髓只有熟习汉语的人才能领会。

“文学艺术翻译要体现情感、色彩、语调、温度、韵致、字里行间的意味等种种幽微之处。要传达出这些,译者的水准、敏感、境界和心灵力量尤为重要。”中国社会科学院外国文学研究所编审高兴说。

缘何能称霸棋坛的人工智能AlphaGo,却在翻译领域不尽完美?何恩培告诉记者:“机器翻译一直被公认为人工智能领域最难的课题之一。而且语言和围棋不同,语言背后的多元文化和复杂社会属性,注定了语言规则不可能规律化。”“文学作品,以及有引申含义或逻辑关系复杂的句子,AI翻译很难搞定,因为翻译它们不仅是基于理解,而且要使某种意义上待翻译的语言和目标语言对齐。”华为诺亚方舟实验室资深研究员、自然语言处理专家吕正东说。

此外,AI翻译要想达到“信、达、雅”的高度,还需克服口语化的两大难题。一方面要听得清,能准确判断出指令发出者的语音、停顿,并在极短时间内进行“语音断句”。另一方面要克服口语交谈中的语法问题,以及句子不连贯、没有明确句子边界等问题。

机器靠什么解决上述问题?在清华大学计算机系副研究员刘洋看来,AI机器翻译的难点其实也是整个人工智能的难点——如何让机器真正像人一样有智能行为。他认为,机器翻译采用数据驱动的方法,其准确程度取决于给计算机提供哪些数据。目前提供最多的翻译数据来自于政府文档,比如联合国有多种官方语言,基本每份文件都有多语种版本,但基本没有体育、娱乐等领域的数据。再加上各国的口语中都存在较多随意性口语或网络用语,生活化气息浓厚,多为非正式的语体材料,因此智能翻译需要庞大的基础词汇库支撑。“其实所有上述问题,理论上来说都可以靠更多的数据来弥补,但是我们数据是有限的。” 吕正东说。

展望:前路漫漫,发展需数据推动

近两年,神经网络机器翻译(Neural Machine Translation, NMT)技术异军突起使翻译应用进一步革新。

NMT模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了55%—85%。目前,谷歌公司己将该技术应用于网页翻译与手机应用,译文质量明显提升。此外,腾讯、百度、阿里巴巴等国内互联网公司也将深度学习理念应用到机器翻译。同时,语言处理、语音交互等技术的进步又加速了翻译产品的场景升级,促使机器辅助翻译”(CAT,Computer Aided Translation)过渡到“人工智能交互翻译”(AI Interactive Translation)。

http://www.cmdmingling.com/post/659.html

AI翻译离无障碍交流有多远的更多相关文章

  1. 含神经网络的离线AI翻译 APP

    功能特性 下载 https://www.microsoft.com/en-us/store/p/translator/9wzdncrfj3pg

  2. C++对象间通信组件,让C++对象“无障碍交流”

    介绍 这是很久之前的一个项目了,最近刚好有些时间,就来总结一下吧! 推荐初步熟悉项目后阅读本文: https://gitee.com/smalldyy/easy-msg-cpp 从何而来 这要从我从事 ...

  3. 为什么AI的翻译水平还远不能和人类相比?

    为什么AI的翻译水平还远不能和人类相比? https://mp.weixin.qq.com/s/0koIt-qu9IOVxNhbFcZr1Q 作者 | SHARON ZHOU 译者 | 王天宇 编辑 ...

  4. 马云谈AI:未来10-15年传统制造业的痛苦将远超今天的想象

    马云谈AI:未来10-15年传统制造业的痛苦将远超今天的想象 “未来10到15年,传统制造业面临的痛苦将会远远超过今天的想象,企业如果不能从规模化.标准化向个性化和智慧化转型,将很难生存下去.” 9月 ...

  5. AI历史和哲学基础浅谈

    换个角度看AI:研究历史和哲学逻辑 正如题图所示,仿生人会梦见电子羊吗?(注:Do Androids Dream of Electric Sheep?是Philip K. Dick所著的一本科幻小说, ...

  6. HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态

    HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以<与虎墩一起,玩转AI新"声"态>为主题,邀请了HMS Core 机器学习服务产品经理.机 ...

  7. 译文 对无障碍网页应用(ARIA)的选择

    //本文编辑格式为Markdown,译文同时发布在众成翻译 对无障碍网页应用(ARIA)的选择 让网站对每个人都能访问是一件相当艰难的工作,尤其是在我们使用自定义标记解决方案(custom marku ...

  8. 2018 AI产业界大盘点

    2018  AI产业界大盘点 大事件盘点 “ 1.24——Facebook人工智能部门负责人Yann LeCun宣布卸任 Facebook人工智能研究部门(FAIR)的负责人Yann LeCun宣布卸 ...

  9. [人工智能]IBM Watson人工智能API|一步步创建智能微信翻译官|第一章

    最近参加了IBM可认知内部创业活动,想从零创建一个微信翻译工具,这就是我的AI翻译官.

随机推荐

  1. eclipse里index.jsp头部报错的原因和解决方法

    index.jsp的头<%@这句报错的话,是因为没有引入Tomcat的原因.解决:A:Window---Preferences---server---RuntimeEnviroments--Ad ...

  2. 【java】聊聊java里的接口

    接口的概念 java中的接口用于描述类应该具备什么样的功能,而不给出具体的实现,一个类可以“实现”多个接口 [注意]接口不是类,而是对类的一组描述   还是让我们通过一个例子来看看接口如何运作吧!   ...

  3. python之socket编程------粘包

    一.粘包 什么是粘包 只有TCP只有粘包现象,UDP永远不会粘包 所谓粘包问题主要还是因为接收方不知道之间的界限,不知道一次性提取多少字节的数据所造成的 两种情况发生粘包: 1.发送端需要等缓冲区满才 ...

  4. temp--达州银行

    达州银行现场 服务器IP地址 192.168.1.234 ilink / ilink 自己电脑需要设置为固定IP 192.168.1.XXX 子网掩码 255.255.255.0 192.168.1. ...

  5. Linux中组 与 用户的管理

    在linux中建立组的指令是 groupadd 组名 相应的,删除组的指令: groupdel 组名 查看自己用户的组: groups 一个用户可以在多个组里面,用这个命令可以将用户添加到组: add ...

  6. 基于pytorch实现HighWay Networks之Train Deep Networks

    (一)Highway Networks 与 Deep Networks 的关系 理论实践表明神经网络的深度是至关重要的,深层神经网络在很多方面都已经取得了很好的效果,例如,在1000-class Im ...

  7. BZOJ2748_音量调节_KEY

    [HAOI2012]音量调节 Time Limit: 3 Sec Memory Limit: 128 MB Description 一个吉他手准备参加一场演出.他不喜欢在演出时始终使用同一个音量,所以 ...

  8. 深入浅出数据结构C语言版(22)——排序决策树与桶式排序

    在(17)中我们对排序算法进行了简单的分析,并得出了两个结论: 1.只进行相邻元素交换的排序算法时间复杂度为O(N2) 2.要想时间复杂度低于O(N2),算法必须进行远距离的元素交换 而今天,我们将对 ...

  9. 1007 正整数分组 1010 只包含因子2 3 5的数 1014 X^2 Mod P 1024 矩阵中不重复的元素 1031 骨牌覆盖

    1007 正整数分组 将一堆正整数分为2组,要求2组的和相差最小. 例如:1 2 3 4 5,将1 2 4分为1组,3 5分为1组,两组和相差1,是所有方案中相差最少的.   Input 第1行:一个 ...

  10. S2_SQL_第二章

    第二章:初始mySql 2.1:mySql简介 2.1.2:mysql的优势 运行速度块,体积小,命令执行的块 使用成本低,开源的 容易使用 可移植性强 2.2:mysql的配置 2.2.1:端口配置 ...