您的位置:首页 >> 科技前沿

科技前沿

微软语音识别“误码率”创业内新低
来源:    发布时间:2016-09-22 10:32:35         [关闭本页]

    科技日报北京9月21日电 (记者房琳琳)据物理学家组织网近日报道,微软宣布了一项关于机器理解人类语言的重要测试结果,即研究人员获得了迄今最低语音识别会话误码率(WER)——6.3%。相关论文发表在论文预印本发布平台arXiv上后,引起了业界关注。

    据了解,该测试是美国国家标准局(NIST)的2000总机语音识别进行的任务。咨询机构Wall Street Pit评论认为,微软团队转向“作为行业标准的电话语音识别测试”成绩斐然,巩固了其在语音识别领域的霸主地位。

    分析认为,微软取得这一成绩来自几个方面的努力:研究人员在今年早些时候,应用深度神经网络技术赢得了一项计算机视觉挑战;微软最近在计算网络工具包(CNTK)中的成熟案例,也是获得本次好成绩的关键组成部分。CNTK实现了“深度学习算法”的复杂优化升级,运行速度比原来提升一个数量级;另一个关键步骤是图形处理单元的并行训练能力取得了突破。

    业内人士表示,近年来,大型软件公司科研经费有被缩减的趋势,且更专注于深度神经网络的研究,但实际上,语音识别技术的应用更早一些。有评论称,过去20年中,研究显示的计算机语音识别系统的最高误码率甚至达到过43%,而随后最出色的单系统NIST2000总机误码率为6.9%。

    在近日于旧金山举行的“Interspeech语音通信和技术国际会议”上,IBM骄傲地宣布其误码率只有6.6%。但此次微软宣布的6.3%的误码率,以微弱优势取胜。

    目前,微软已经制定出了基于语音平台的人机交互策略,成功构建起人工智能的关键技术,让相关语音对话在可穿戴设备、智能手机、智慧家庭、智慧车辆及商业服务中发挥重要作用。

设为首页 | 加入收藏 | 领导信箱 | 监督举报 | 咨询留言 | 征集调查 |
Copyright ©2001-2025 濮阳市科学技术局主办 濮阳市科技创新综合服务中心承办
备案编号: 豫ICP备2021001807号       政府网站标识码:4109000036
Tel:0393-6661626 科技局办公室电话:0393-6666200 传真:0393-6666200

本网原创内容可免费转载,转载时请注明“来源:濮阳市科学技术局”。转载或引用本网内容必须是目的合理、善意引用,
不得对本网内容原意进行曲解、修改,并自负版权等法律责任。对于不当转载或引用本网内容而引起的民事纷争、行政处理或其他损失,
本网不承担责任,并有追究转载方法律责任的权利。