人工智能走出实验室 阿里云加速落地语音技术

继AlphaGo挑战李世石4:1获胜之后,阿里云也在人工智能领域向人类发起挑战。

近日,阿里云在2016年会上公开展示实时语音识别技术,并现场挑战世界速记大赛亚军得主。据现场最终评测,机器人在准确率上以0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军姜毅。

阿里云年会现场,图中左边屏幕显示的是语音识别,右边屏幕显示的是人工速记

从现场效果看,人工智能的稳定性和并发计算能力是其优势。人类的体力是有极限的,尤其是在高强度压力下,工作时间越长出错概率越大,而机器则能自始至终保持同一水平。这一点在AlphaGo和李世石的围棋比赛终中也反复得到验证,在比赛中、后局机器的稳定计算能力远超人类。

此外,人工智能的并发能力也非人工所能及。在发现错别字后,机器可以瞬间修改所有错误,人工速记则需要在演讲人短暂间歇的时刻返回修改,明显表现得慌乱。

阿里云iDST 语音组总监鄢志杰表示,虽然已经在接近世界一流的“速记师”的路上,但人工智能还有很长一段路要走。“在噪声、口音以及对未见到过的数据的适应性上,人类显然更胜一筹。”

速记师姜毅则评价,虽然和人工智能比赛压力很大,但“机器还是缺了一点点智慧”,并表示非常愿意收下这个“机器徒弟”,教会它更多的速记诀窍。

“看起来是机器挑战人类,其实是人类在挑战自己。”姜毅强调,“人工智能背后凝结的科学家智慧是人类的骄傲。”

第50届国际速联速记大赛于2015年在匈牙利布达佩斯举办,姜毅作为中国代表队的九名选手之一,在文本看打速记比赛项目中以大约300字/分钟的速度获世界亚军。

姜毅在会议现场和看不见的机器人PK

核心算法+GPU计算

所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。

随着自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口,苹果Siri等是个人智能助理类典型应用。而语音识别则是人机交互的第一步。

据介绍,此次“人机大战”的语音识别算法主要基于BLSTM(双向长短时记忆神经网络),这种算法对单位时间内的计算量要求很高,因此阿里云采用了带GPU加速的新一代高性能计算平台,单节点计算能力达16 Tflops,并且对BLSTM算法做了针对性优化,实时解码更为顺畅。

走出实验室赋能应用

阿里云iDST智能语音团队拥有世界一流的专家团队,此次年会展示的研发成果只是冰山一角。实际上语音技术已经走出实验室,在阿里内部广泛应用,比如赋能阿里集团客服和蚂蚁金服客服团队的呼叫中心智能化。

去年双11,蚂蚁金服95%的远程客户服务已经由大数据智能机器人完成,同时实现了100%的自动语音识别。蚂蚁金服客户中心整体服务量超过500万人次,客服人员的精力可以更好地集中到处理复杂类客户问题和工作。

同时,语音团队还把智能语音交互技术赋能给YunOS以及手机淘宝、支付宝、钉钉等移动端应用。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。