自然语言处理到底哪家强?这些企业上榜了
自然语言处理是包括了计算机科学、语言学心理认知学等一系列学科的一门交叉学科,这些学科性质不同但又彼此相互交叉。
1950 年图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端。
20 世纪 50 年代到 70 年代自然语言处理主要采用基于规则的方法。
70 年代以后随着互联网的高速发展,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。
从 2008 年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究。
由最初的词向量到 2013 年 word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。
接下来 AMiner 将为大家介绍自然语言处理的业界发展,涵盖了以下企业。
微软亚洲研究院微软亚洲研究院 1998 年成立自然语言计算组,研究内容包括多国语言文本分析、机器翻译、跨语言信息检索和自动问答系统等。
这些研究项目研发了一系列实用成果,如 IME(Input Method Editors 输入法编辑器,它是一种专门的应用程序, 用来输入代表东亚地区书面语言文字的不同字符。)、对联游戏、Bing 词典、Bing 翻译器、语音翻译、搜索引擎等,为微软产品做出了重大的贡献。
微软 IME
微软对联游戏
微软必应词典
并且在自然语言处理顶级会议,例如 ACL、COLING 等会议上发表了许多论文。
语音翻译
2017 年微软在语音翻译上全面采用了神经网络机器翻译,并新扩展了 Microsoft Translator Live Feature。
可以在演讲和开会时,实时同步在手机端和桌面端,同时把讲话者的话翻译成多种语言。
其中最重要的技术是对于源语言的编码以及引进的语言知识,同时,微软还表示,将来要将知识图谱纳入神经网络机器翻译中规划语言理解的过程中。
人机对话
小娜现在已经拥有超过 1.4 亿用户,在数以十亿计的设备上与人们进行交流,并且覆盖了十几种语言。
有聊天机器人小冰,正在试图把各国语言的知识融合在一起,实现一个开放语言自由聊天的过程,目前小冰实现了中文、日文和英文的覆盖,有上亿用户。
Google 是最早开始研究自然语言处理技术的团队之一,作为一个以搜索为核心的公司,Google 对自然语言处理更为重视。
Google 拥有着海量数据,可以搭建丰富庞大的数据库,可以为其研究提供强大的数据支撑。
Google 对自然语言处理的研究侧重于应用规模、跨语言和跨领域的算法。
机器翻译
知识图谱
Google 的知识图谱更是遥遥领先,例如自动挖掘新知识的准确程度、文本中命名实体的识别、纯文本搜索词条到在知识图谱上的结构化搜索词条的转换等,效果都领先于其他公司,而且很多技术都实现了产品化。
语音识别
Google 一直致力于投资语音搜索技术和苹果公司的 siri 竞争,自 2012 年以来将神经网络应用于这一领域,使语音识别错误率极大降低。
2011 年收购语言信息平台 SayNow,把语音通信、点对点对话、以及群组通话和社交应用融合在一起。
2014 年收购了 SR Tech Group 的多项语音识别相关专利。
Facebook 涉猎自然语言处理较晚,2013 年开始发展语音翻译,2015 年开始语音识别的研发之路。
语音翻译
发展道路如下图所示:
语音识别
2015 年,Facebook 相继建立语音识别和对话理解工具,开始了语音识别的研发之路。
2016 年 Facebook 开发了一个响应“Hey Oculus”的语音识别系统。
并在 2018 年初开发了 wav2letter,这是一个简单高效的端到端自动语音识别(ASR)系统。
百度
百度自然语言处理部是百度最早成立的部门之一,研究涉及以下方面。
百度在深度问答方向经过多年打磨,积累了问句理解、答案抽取、观点分析与聚合等方面的一整套技术方案,目前已经在搜索、度秘等多个产品中实现应用。
百度翻译目前支持全球 28 种语言,覆盖 756 个翻译方向,支持文本、语音、图像等翻译功能,并提供精准人工翻译服务,满足不同场景下的翻译需求,发布了世界上首个线上神经网络翻译系统,并获得 2015 年度国家科技进步奖。
阿里巴巴
阿里自然语言处理为其产品服务,在电商平台中构建知识图谱实现智能导购,同时进行全网用户兴趣挖掘,在客服场景中也运用自然语言处理技术打造机器人客服。
例如蚂蚁金融智能小宝、淘宝卖家的辅助工具千牛插件等,同时进行语音识别以及后续分析。
阿里的机器翻译主要与其国家化电商的规划相联系,2017 年初阿里正式上线了自主开发的神经网络翻译系统,进一步提升了其翻译质量。
腾讯
AI Lab 是腾讯的人工智能实验室,研究领域包括计算机视觉、语音识别、自然语言处理、机器学习等。
其研发的腾讯文智自然语言处理基于并行计算、分布式爬虫系统,结合独特的语义分析技术,可满足自然语言处理、转码、抽取、数据抓取等需求。
在机器翻译方面,2017 年腾讯宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到满足,语音识别 +NMT 等技术的应用保证了边说边翻的速度与精准性。
京东
京东在人工智能的浪潮中也不甘落后。京东 AI 开放平台基本上由模型定制化平台和在线服务模块构成,其中在线服务模块包括计算机视觉、语音交互、自然语言处理和机器学习等。
按照京东的规划,NeuHub 平台将作为普惠性开放平台,不同角色均可找到适合自己的场景,例如用简单代码即可实现对图像质量的分析评估。
从业务上说,平台可以支撑科研人员、算法工程师不断设计新的 AI 能力以满足用户需求。
并深耕电商、供应链、物流、金融、广告等多个领域应用,探索试验医疗、扶贫、政务、养老、教育、文化、体育等多领域应用。聚焦于新技术和行业趋势研究,孵化行业最新落地项目。
科大讯飞
科大讯飞股份有限公司成立于 1999 年,是一家专业从事智能语音及语言技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。
科大讯飞作为中国智能语音与人工智能产业领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。
科大讯飞成立之时就开始在语言和翻译领域布局项目。基于深度神经网络算法上的创新和突破,在翻译方面的发展如下图所示。
关于 AMiner:
以科研人员为中心,提供在线实时的人才、科技评估报告的情报。追踪、关注人工智能 +20 领域的发展动态。
(选自:学术头条(SciTouTiao)作者:AMiner)
查看评论 回复
"自然语言处理到底哪家强?这些企业上榜了"的相关文章
- 上一篇:培训班不火,币圈哪来的“未来”
- 下一篇:福布斯专访湖畔大学教务长曾鸣:谈中国式创新