本篇文章2439字,读完约6分钟

作者:王健

在北五环外的北京郊外,刚建成的百度科技园成为了这里的新地标。 五座办公楼,天桥互相连接形成环状,阳光照射的蓝色玻璃幕墙有一些“未来感”。

作为中国互联网公司的巨头之一,百度企业近年来积极部署人工智能行业。 年初,中国举办了国家科学技术奖励大会,该企业的机器翻译项目获得了国家科学技术进步二等奖,中国最高级的科学技术奖落在网络公司是很少见的。

说到“出乎意料”获奖,项目负责人王海峰看起来非常平静。

↑王海峰获奖照片。 百度提供照片

“百度翻译在科研水平和应用价值两方面都有很大的特点,在国际上处于领先水平,符合国家科技进步奖的标准。 ”。 他说。

年,刚进入百度的王海峰开发了机器翻译。 “当时预计这个行业的研究一定会有很大的突破。 一是因为社会对机器翻译的诉求越来越旺盛,更重要的是,百度可以为这项研究提供互联网的大数据和大规模计算平台的有力支持”。 “项目开始仅仅一年多,现在百度的翻译可以支持27种语言之间的翻译,世界上有5亿客户,每天支持约1亿次的翻译诉求。 ”。

耳朵虚,眼睛有果实。 王海峰马上拿着自己的手机说:“来吧,我给你看。”

他一边说一边打开百度翻译app,输入了“喜大普奔”四个字。 百度翻译app的一句英语翻译,想象了这个网络用语所表达的意思,正确地进行了说明。

↑百度翻译app手机接口

王海峰又在下面的手机上说:“附近有餐馆吗? ”输入了声音。 然后百度翻译app的语音翻译功能分别翻译成英语、韩语、粤语,翻译得很好。

“也可以自动识别和翻译图像。 ”他一边这么说,一边用手机拍写着中文的纸,选择其中之一,手机画面上马上出现这句话的翻译,“点击这里,也可以用声音阅读翻译结果”。

“我自己已经是机器翻译的直接受益者,”王海峰说。 机器翻译技术对生活的变化已经很深了。 “比如,前段时间去葡萄牙出差,一句葡萄牙语也不会,但是通过手机百度翻译,旅行中几乎没有遇到过语言障碍。 ”。

在研发过程中,王海峰带领团队不断分析顾客的诉求。 “我们通过监视访问量,发现周末访问量增加,星期天特别多。 我们可能正在分解很多中小学生做作业时用来宣传我们的产品。 “另外,电子商务行业的应用也很多,比如很多网店用我们的翻译软件把他们的产品介绍翻译成外语,所以节约了他们的翻译成本。 ”。

↑王海峰在自己的办公室。 百度提供照片

根据王海峰和团队的构想,百度翻译发表了越来越多的中国方言和少数民族语言,满足越来越多的客户诉求。

“开发语言对我们来说并不难。 平均11天可以访问新语言。 ”他说

有必要成立这么有效率,巨大的多语言技术人才队伍吧?

“其实我们的核心翻译工程师不到10人,在研发过程中不依赖外语能力,我们开发的大部分语言我们自己都不擅长。 》王海峰说:“这就是机器翻译的魅力。 对于需要翻译的语言,只需自动发掘网上存在的双语数据,机器从这些数据中自动学习,就可以得到自动翻译的模型。 此外,翻译系统可以通过学习客户的反馈数据来提高翻译能力。 ”。

机器,你怎么有这样的能力?

王海峰表示,百度开发的深度学习与多种主要翻译模式相结合的在线翻译系统和基于“枢纽语言”的技术处于行业领先水平,得到国际广泛认可。 基于深度学习的在线翻译系统通过计算机模拟的庞大神经元“理解语言,生成译文”。 基于枢纽语言的技术,通过将网络数据不足的小语言之间英语、中文等数据丰富的大语言作为“枢纽”进行翻译,可以进行小语言的翻译。

成功的背后是多年的积累和失败的尝试。 王海峰说:“初期,我们在网上很多两文训练了系统,但结果完全不令人满意。 例如,简单的英语“‘how old are you”最后被翻译成了“怎么总是你”。 原来,网上错误翻译的新闻规模比我们想象的要大,所以我们开始研究如何过滤和筛选网上的数据。 ”。

说到机器翻译,当然不能不提谷歌翻译。 与谷歌翻译相比,百度翻译有什么独特之处?

“百度翻译的特征是,融合了技术深度的学习模式和许多主要的翻译模式,结合检索技术,在口语、诗词、文言文翻译、中文相关的翻译质量等方面有明显的特征。 另外,翻译的时间也非常长,我们的翻译系统对现在的网络语言的翻译也很精通。 ”。 王海峰回答说。

↑百度推出的多语言翻译机器人“小度”与海外嘉宾交流。

这么说吧,王海峰和机器翻译有缘,20多年了。 除了百度技术副总裁的身份,他还有一个头衔——百度基础技术首席科学家。 1993年,哈尔滨工业大学计算机系的大四学生王海峰认为“感觉不可思议”,选择了智能翻译作为自己毕业设计的课题,进入了这个行业。

有可能性吗? 总有一天机器翻译会取代人工翻译吗?

王海峰先生肯定说:“不,我想不是。” “不仅威胁译者的生存,而且给他们带来工作上的便利。 据我所知,很多译者的手机也安装了我们宣传的产品。 机器翻译和人工翻译各有特点,一个机器翻译系统能掌握几十种语言的翻译能力,也擅长多个行业的翻译。 这个在译者身上没有。 但是,优秀的译者可以把语言的细微之处翻译成精妙的美感,这也是机器翻译系统所不可能的。 所以,两者是相辅相成的,不能互相取代”。

尽管获得了奖项,王海峰仍不放松继续探索和突破的步伐,“曾经的我们与海外先进水平有差距,经过近几年的不懈努力,赶上了这些差距。 现在我们可以自信地说我们达到了世界领先的水平,这意味着我们要负责领导创新,领导突破。 ”。

因此,技术的追求成为百度科技园内的文化现象。 百度翻译研究开发小组的何中军工程师告诉记者,这里的技术人员像拿着手机一样随身携带着笔记本电脑,“上厕所的时候也有”。

“我们开发的是,一刻离开电脑后就会心神不定。 因为随时都有可能出现必须尽快应对的技术课题。 ”他说

在与记者对话的过程中,王海峰偶尔把目光投向窗外。 那是还在施工的工地,大楼的骨架已经脱落了,但高耸的脚手架和隐隐约约听到的轰鸣总是提醒我们:一切还在继续……

(图上没有显示图像全部来自互联网。 (作者:王健)

标题:“对话百度王海峰:机器能翻译,还需要学外语吗?”

地址:http://www.cfcp-wto.org/cfzx/20173.html