百度、斯坦福研究表明 语音输入比打字快3倍且准确率更高

8月25日消息,近日,百度、斯坦福大学和华盛顿大学共同完成了一项有关智能手机输入方式对比的研究,该研究利用百度深度语音识别技术DeepSpeech2与32名测试者进行“人机对战”。研究结果表明,智能手机利用语音输入的速度比键盘输入快3倍,且输入准确率更高。

研究人员发现,相比于传统的键盘输入,语音输入方式在速度及准确率方面更具优势。利用语音输入英语和普通话的速度分别是传统输入方式的3.24倍和3.21倍。此外,通过加入纠错功能后,语音输入英语及普通话的准确率进一步提高,达到96.43%和92.35%,输入速度仍为传统方式的3倍和2.8倍。该研究将语音输入方式的评估细化到了字符级,充分展现了语音输入方式的优势,帮助技术研发者进一步优化语音输入的效果。除此之外,技术人员还研究了如何在详细数据分析和定向响应的基础上,进一步提高语音输入的效率和准确率。

斯坦福大学计算机科学专业教授JamesLanday表示:“过去十年,语音识别技术被寄予厚望,但实际表现却不尽如人意。近两年,受益于大数据和深度学习技术的不断发展,语音识别技术突飞猛进,速度及准确性都有了长足进步。除了打字发邮件或短信外,我们还在将语音用于更多方面。比如语音启动和图形触控操作相结合的交互界面等。”

此次参与研究的DeepSpeech2,是百度布局语音技术的重要产品。2014年底,百度首席科学家吴恩达及其团队便发布了第一代深度语音识别系统DeepSpeech,该系统使用了端对端的深度学习技术,主要专注于提高嘈杂环境下的英语语音识别的准确率。通过使用批处理技术将DNNs部署在GPUs上,DeepSpeech的语音识别表现出了极高的训练效率。目前,该系统语音识别准确率达到97%,且支持超过26万亿次浮点运算,可在几天内完成深度语言的集中训练。2015年11月,DeepSpeech2被美国权威杂志《麻省理工科技评论》列为2016年人类十大突破技术之一。

除了强大的技术研发能力,百度还积极推进语音技术的普及。无论是Carlife、还是度秘,乃至应用到搜索、地图等领域的语音技术,都极大优化了产品体验并方便了人们生活。除此之外,百度还通过自身的语音技术开放平台,将技术能力免费开放,通过SDK、API等不同的接入方式供企业及开发者使用,进一步刺激语音识别技术的创新应用开发。其中,行业用户包括小米、联想、特斯拉、陌陌、康佳、SONY、惠普、海尔等。未来,随着语音技术的不断发展,语音接口会变得更为实用和有效,人们将更为便捷的与身边的设备进行自然的交流。(王卡卡)

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。