百度在奥运期间搞了一场人机大战 这次要挑战人类解说员

新浪科技 李根

如何不再忍受一个你不喜欢的球赛解说员?除了换台和静音,现在有了新的方式——用机器淘汰他。

比起人来说,机器没有情感偏向,几乎不会出现低级错误,比如把赞助商sharp当作球员名字进行介绍,也不会因为把握不好节奏漏掉关键的比赛细节,对于历史数据和信息,甚至没有人能击败它,因为它所拥有的是无限的资料库和迅速搜索分析的能力,而人只能凭借大脑和记忆。

用机器实时解说比赛,这是人工智能和机器学习的场景性应用之一。在这个过程中可以训练机器对于实时场景信息的处理、分析、解读和判断能力。而且如果对于一场高速进行的球赛都能实时解说,那这种机器的模型和能力就还能应用到更多场景和情况中。

百度版“人机大战”

出于上述考虑,百度度秘研发团队正在训练旗下人工智能机器人助理——度秘,解说奥运男子篮球赛,而且为了让这种解说更富挑战性和交互性,度秘团队请来了拥有多年篮球解说经验的杨毅,他将和度秘同场搭档解说。这是百度版的“人机大战”。

篮球解说员杨毅在解说直播间,他的搭档将是面前的机器

不同以往,这次别开生面的人机解说带有协作性质,但也充满挑战意味。机器和人的差异,可以在赛前、赛中和暂停休息等三个不同场景中被明显感受到。

在赛前,对于两队各自情况和数据记录,度秘表现出了机器所具备的“博学性”和准确性,它准确调取了球员信息、历史对战数据等。而这部分工作以前往往是人类解说员的“功课”,不少解说员需要赛前花费大量时间搜索、归纳和整理。

杨毅的解说则只能更加偏向人文性和趣味性,带有较强的主观感性。比如介绍立陶宛时,他能够介绍到立陶宛知名的啦啦队美女,以及如何在立陶宛叫到一扎啤酒。类似这样的知识,度秘或许也知道,但它很难主动告诉你,除非在个性化训练和调校中,它知道你对这些方面的知识感兴趣——它会在后台通过“标签”给用户描绘画像。

比赛中,度秘则开始展现实时解说比赛的能力,“谁,什么状态,在做什么事情,最后结果如何”,这些比赛基本要素它能够表述清楚,现场体验来看,相当于在通过收音机观看比赛。实际上,图文版也在同步进行中,但完全是机器自发的行为,不用再耗费任何人力。而此时,杨毅的作用则是带来围绕某个状态和场景延伸开去的信息,并且丰富解说氛围。打比方来说,杨毅和度秘在整个比赛过程中相当于在进行一场相声表演:杨毅是插科打诨的捧哏,度秘则是不断围绕主线进行阐述的逗哏。

而在中场休息时间,度秘则带来总结分析,比如数据统计方面,或者更加个性化的数据情况,如某个球员的具体数据等。这些数据此前依赖于赛会组织方面的统计,只有赛会方面统计完毕才能分发到解说员,但现在,机器可以在解说的同时完成这部分工作,并在实时比赛间隙播报。如果你是一位“教练”型的观众,那通过机器带来的数据能够更加清晰地掌握比赛走势——此前则有赖于解说员的个人风格,毕竟不是每一个解说员都爱在休息时间用数据分析比赛。

此外,如果你是一位爱听段子的球迷,机器也能从评论中抓取有趣的评论或人气较高的评论进行“解说”。

机器解说的背后原理

从技术原理的角度来说,度秘目前可以实现的“解说”能力主要基于自然语言处理技术(NLP)。简单来讲,这个处理过程和技术大致可以分为:对需求信息分析理解、获取基本信息(包括对文字和图片的信息的搜集、分析和理解)、实现智能化输出和有风格的解说。

其实这个过程也包含了目前人工智能领域的几大核心技术:语音识别、大数据计算和机器学习。

但赛事解说的特殊性在于它比语音识别更加复杂,也比一般的聊天互动需要更高的智能化程度,因为解说需要基于领域知识,面向不同层次、需求的用户,理解比赛当时的形势,用自然、流畅、生动的人类语言讲解出来。

自动解说主要从机器翻译技术上找到灵感,基于统计和机器学习方法,把基本的统计数据翻译成有趣的人类语言解说。为了实现这种“有趣”和解说风格,度秘学习了NBA和2012伦敦奥运会篮球赛的几百场比赛文字解说,不仅讲人话,还学到了风趣幽默、表情包的运用等。

比如在解说某个球员投篮打框未命中时,度秘的表述是:“XXX上篮,咣当,仿佛听到打铁的声音。”另外,在给大家介绍奥运会篮球比赛三分线和NBA三分线规制的不同时,它如此说道:“奥运会比赛三分线XX米,NBA三分线XX米,不过还有一种三分线叫库里。”这就是机器学习了人类解说资料的结果。

为什么是篮球解说?

对于此次选择从篮球比赛解说入手的原因,新浪科技也询问了百度大搜索总产品架构师景鲲,得到的解答是度秘团队认为篮球比赛场景更加丰富、进行速度更快、交互更加频繁,对于机器学习和训练更加有挑战,此外,篮球比赛受众范围更广,在国内关注程度高,可以获得更多更及时的用户反馈。当然,另外一个隐秘的原因是度秘团队中有不少工程师是篮球爱好者。

度秘此前单独解说中美篮球赛

不过,除了篮球比赛,机器解说可能在足球比赛中会更加受到欢迎。因为足球比赛场景要比篮球比赛少,但是涉及的数据和知识又会更多。所以在数据方面,机器解说会超越任何解说员的“活字典”般的记忆;其次是对于场面的分析,结合数据会更加有针对性的分析。

实际上,这一定程度上也能帮助球队教练做决策,比如通过机器解说掌握的数据情况,不断分析球员状态和场面因素,能够帮助教练实现及时调整。

其实,将科技运用于比赛训练和执教并不稀奇,目前世界上最为优秀的足球教练之一魔力鸟穆里尼奥就一直通过iPad和应用帮助自己分析比赛,及时作出关键决策和判断。

不过对于度秘团队来说,通过机器解说球赛的方式训练,目的并不是简单代替“解说员”,他们希望通过这样场景化的机器学习训练,未来可以将模型和方法应用到更多更广泛的场景中。“比如北京大雨天气会造成露面积水,那度秘可以对各方面信息和数据做出综合判断和分析,引导避开积水路段。”百度多模搜索部总监孙雯玉介绍说。

当然,度秘团队的“野心”是最终能打造出一款“我的度秘”,它能够全知全能,给用户生活、工作提供更多的个性化帮助,更加便利和智能。但目前来讲,技术上尚无法实现这种“全知全能”,对于发布即将满一周年的度秘,度秘团队希望在今年内推出的2.0版本会有更多场景化和个性化上的丰富。

机器会让解说员失业吗?

如果把机器解说放到更宽泛的人工智能进展中来看,那也可看做是机器对于人类活动和能力的一种替代。在让实时翻译员、财报编辑和速记等“失业”后,度秘之类的机器程序正在让部分“解说员”下岗。

拿目前人工智能业界的论调来说,这些被替代的工作里,很大一部分是“简单的重复的脑力劳动”。相比于工业革命对体力劳动的解放,目前汹涌而来的人工智能革命正是奔着解放部分脑力劳动去的。

机器在资料收集和分析方面具备优势

不过不必担心的是,人工智能固然有计算方面的天然优势,但具体到解说这种领域,机器也肯定不会完全取代人类。比如机器再如何学习、“吃”了多少解说资料,都必然不会在比赛中灵光乍现,脱口而出“他继承了意大利左后卫的光荣传统,这一刻他不是说一个人在战斗,他不是一个人!”之类的激情解说。

这样的时刻有些类似人机围棋大战里,李世石击败AlphaGo的那一局中的“神之一手”。归根结底,人类所具有的感性和灵感的那部分,机器尚不能习得,也无从学起。

然而有意思的是,如果完全通过机器来解说比赛,那解说界再也不用担心被批评“不中立”,也不用在比赛中不断被球迷吐槽了。不知道这是否意味着在解救一部分不堪忍受糟糕解说的球迷的同时,也让观看比赛少了吐槽解说的乐趣。

但另一个更有意思的事情是,如果未来某天AlphaGo真的要来中国挑战柯洁,那这次就可以实现双重人机大战了。一方面是机器和棋手下棋,另一方面是机器和人在解说分析上较劲。

当然,这时的你也能用机器助手叫个外卖小龙虾之类的。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。