/zh/default.asp 企业邮局 cx189.net 网页被屏蔽详情   一键卸载360
 
/zh/default.asp 登录
用户名
密码
 
cx189.netcx189.netcx189.net
本系统支持 WEB或者 POP3收发邮件。

如果要使用FoxMail等软件收发邮件,请注意:

SMTP服务器和 POP3服务器都是 mail.cx189.net

SMTP服务器需要身份验证,用户名要填 user@ 域名后缀

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

诚信在线-诚信在线下载-诚信在线娱乐官方网

www.cx189.net-诚信在线客户端下载

当前位置: 主页 > 阳光在线 >

语音识别首次全平台比拼,讯飞依图BAT各家算法差异巨大

时间:2018-12-12 00:09来源:www.cx189.net 作者:诚信在线 点击:
投中网(https://www.chinaventure.com.cn) 编者按:对于AI公司来说,要实现真正全面的智能,进入智能语音领域,是一个必然。 2010年,微软公司的邓力和其团队与多伦多大学的Hinton教授合

  投中网(https://www.chinaventure.com.cn)

  编者按:对于AI公司来说,要实现真正全面的智能,进入智能语音领域,是一个必然。

  2010年,微软公司的邓力和其团队与多伦多大学的Hinton教授合作,首次将深度学习引入语音识别,率先取得突破,驱动了语音识别技术的高速成长。到今天短短8年时间,便取得了远超过去半个世纪的成就。

  今天,语音识别技术已大量落地,从语音输入法等应用,到智能音箱、智能机器人(行情300024,诊股)等智能硬件大量涌现。特别是在中文语音市场,玩家众多,市场也已略显拥挤。而不少行业巨头都纷纷更是表示语音识别准确率已从97%进化到98%,似乎在技术层面,语音识别已经趋于完美。但是,事实是否真的如此呢?

  近日,依图科技“突袭”中文语音识别,公布了在这一领域的成绩。在使用AISHELL-2数据库进行测试的结果显示,依图的准确率全面领先。这不禁让人思考,中文语音识别目前到底是什么状态,还有多大空间?

  公开测试显示,中文语音识别算法良莠不齐,算法能力远未超越人类。

  到目前为止,虽然整个行业都在宣传语音识别的字错率或词错率距离100%只差2~3个百分点,但是否意味着已经达到真正好用的程度,以及当前到底发展到了什么样的地步,很多人并没有一个清晰的认知。

  无论是博鳌亚洲论坛AI同传词汇翻译不准确、重复等低级错误,还是平昌奥运会挪威队主厨使用谷歌翻译订鸡蛋事故,以及前不久小米AI+IoT开发者大会上小爱同学的现场翻车,语音识别正被越来越多人引为笑谈。这些事例,似乎可以看作是当前语音识别技术现状的一个缩影,同时也可以看到,语音识别这个最容易考试的技术,距完美还相差甚远。

  有一个事实可以说明问题,最近几年,计算机视觉领域的人工智能新创公司不断涌现,其中不少已成长为独角兽。但是,语音识别领域的独角兽却少之又少。其中的原因有多个方面。从表层来看,语音识别的数据成本高、投入大,相关研究人员稀少。而更核心的是来自技术层面,包括语音模型对多应用场景的泛化能力不足,以及结合上下文语义的推理能力不足等等。

  这些尚未突破的技术壁垒,或许可以解读为上述案例所体现出来的问题。当前理想的语音识别,几乎都是在近场、安静等受限场景下实现的,但真实的语音交流的复杂度远不止于此。受限的应用场景,会显著影响更大规模的落地应用。这导致语音识别商业变现的速度远远不及视觉领域,自然无法在短时间内发展出独角兽公司。

  事实上,即便是大公司,也面临过类似的问题。IBM曾放弃了研究多年的ViaVoice语音系统,就是因为难以找到好的盈利模式。当前语音行业的巨头,也大多无法单纯依靠“卖技术”来构建自己的商业模式。

  技术需要突破,但推动行业的进步,更需要统一公认的衡量标准。当前业内对于中文语音,目前并没有一个公认的测试基准,各家各执一词,甚至不公布测试基准,导致行业乱象。可以说,中文语音识别,仍有很长一段路要走。

  依图首席创新官吕昊博士解读行业现状

  进入语音是必然,依图或开启AI应用新方向

  语音是更自然的人与人的交互方式,也是人机交互最重要的入口。如果说视觉是人获取信息的主要渠道,那么语音则是人输出信息的主要渠道。可以说,语音识别是AI理解世界最重要的组成部分。因此,对于AI公司来说,要实现真正全面的智能,进入智能语音领域,是一个必然。

  因此,做视觉技术的企业,在深化业务落地时,就会发现,视觉+语音这种复合型的AI技术需求,会大于单一型AI技术需求。所以,有些视觉企业选择了与语音企业合作,诚信在线最新客户端下载,依图则选择了自主研发这条道路。而此次依图首次公布语音识别领域的背后成果,或许会掀起更多视觉企业对语音识别的关注。

  事实上,此次依图取得的突破,不仅仅是表面上准确率的进一步提升,其更大的价值在于在多场景的测试中均有良好的性能表现。根据依图公开的成绩数据来看,除了在AISHELL-2这一全球最大的中文开源数据库上位居第一外,在来自第三方的近场口音测试集、近场安静聊天测试集、语音节目测试集、电话测试集、远场测试集中,依图均处于业界领先水平,且字错率几乎全部在15%以下。这证明了依图在语音的算法模型方面,已经具备了行业领先的泛化能力。

  访问“听写大会”小程序,直观比拼语音识别效果

(责任编辑:阳光在线rg6899.com)
------分隔线----------------------------
推荐内容