扫码手机轻阅读

AI合成主播亮相两会,噱头价值远大于实用价值?

  • 如今的机器还没有掌握像知识、推理概念的能力,还不具有创造性,在这种层面上机器与人的距离相差很远,机器只能做一些重复性的事情,更谈不上机器取代。
  • 全国两会新闻不断,你看过两位AI合成主播播报的新闻了吗?

    3月3日,新华社联合搜狗开发的全球首位AI合成女主播“新小萌”正式上岗,与名为“新小浩”的AI合成男主播一同进行两会报道。

    2018年11月的乌镇互联网大会上,全球首个AI合成主播“新小浩”正式诞生。四个月后,AI合成主播已经从过去只能坐着播报新闻升级为站立式播报。据了解,AI合成主播“入职”新华社以来,已生产3400余条新闻报道,累计时长达10000多分钟。

    一手缔造“新小萌”的搜狗CEO王小川今天接受媒体采访时透露,他带着AI合成主播来开两会,希望能够帮他做一些应对。目前尚不清楚,AI合成主播能够帮助小川应对何种事情。

    AI合成主播背后的黑科技到底是什么?未来主播这一岗位是否会被人工智能彻底取代?

    技术并不新鲜

    日本早就玩起了虚拟主播,比“新小浩”还要早。

    虚拟主播 Kizuna

    2017年11月,一位被玩家爱称为“人工智障爱酱”的日本虚拟主播在Youtube上开始流传。这位名叫“Kizuna AI”的3D萌妹经常抖机灵,时而恶意卖萌地说一些不着边际的话,时而吐槽自黑,吸引了众多宅男的目光。

    虚拟主播 Yomiko

    看到虚拟主播如此受欢迎,2018年4月日本放送协会(NHK)宣布在节目中使用AI主播“Yomiko”播报新闻。“Yomiko”在工作日晚间23时10分播出的“NEWS CHECK 11”节目中登场,每周播报一次约5分钟的新闻。

    这位AI主播“Yomiko”是通过CG技术制作,模拟真人发音的AI主播。技术人员事先请NHK旗下的主播阅读大量新闻稿件并录音,然后将这些语音数据分解为10万个音素,再通过“Yomiko”播报出来。为了让播报更加自然,技术人员还让Yomiko事先记住了日本全国的地名、专有名词、口音等。

    新华社和NHK分别推出的AI合成主播有一个明显的区别,前者采用的是真实人脸模式,后者则是虚拟卡通人物。

    除去上述差异外,背后采用的技术有诸多相似之处。

    首先是动作捕捉技术。这种技术最早被用于上个世纪的物理研究,专门用来分析物体的移动特性。

    随着体育界大量应用动作捕捉技术,影视动画和游戏行业也加入了这个行列。在探访大片制作现场的时候,如果你看到有人穿着一件镶嵌着无数白点的黑衣服在做奇怪的动作,就一定是在给动态捕捉拍摄底板。通过把人体关节动作在计算机中重新解析和配上肌肉,动画人物就能做出和演员一模一样的动作。

    其次是人脸识别技术。人脸识别其实和动作捕捉在原理上没有太多的区别,只是人脸肌肉的移动精密度更高,更难以捕捉细节而已。随着人脸识别算法的进步,现在软件能够通过摄像头捕捉到的面部表情被简化成80多个位点,在卡通人物的脸上移动相应的位点就能模拟出人做的表情。

    最后就是语音合成技术。该技术能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。至于转化声音则更简单,目前市面上有不少免费的声音转换器。

    NHK模式的定制化虚拟AI主播,表情、唇动、肢体动作都相对较少。新华社的真人模式突破了以往语音图像合成领域中只能单纯创造合成形象、并配合语音输出唇部效果的约束,极大地提高了观众信息获取的真实度。

    噱头价值远大于实用价值?

    某种意义上,AI合成主播并非什么了不起的黑科技,只是目前已经在大规模使用的动作捕捉、人脸识别、语音合成等技术在媒体领域的一次实际应用而已。

    而且,AI合成女主播“新小萌”的缺陷显而易见。

    最明显的是,“新小萌”声音机器感强,嘴唇动作僵硬。有网友表示听她播报时间长了会感觉不舒服,还有网友质疑“就是录了几个主播的状态,换了个嘴,嘴还弄的贼尬”。此外,还有诸如表情僵硬、大小脸等问题。

    人类新闻主播的工作不仅仅是播报新闻信息,也会与观众进行情感交流互动。相比之下,“新小萌”目前仍停留在播报阶段。

    例如,在灾难发生时,人类新闻主播会自然流露出对于不幸的悲悯与同情;在节日来临时,人类新闻主播会以一种欣喜昂扬的姿态面对受众。这些表情、语调,AI合成主播很难达到人类主播的水平并引发观众内心的共鸣。

    此外,AI合成女主播不具备独立思考的能力,而人类新闻主播可以在直播过程中对新闻稿件进行随机应变的灵活处理,这也是人类新闻主播不可替代的部分。

    换句话说,AI合成主播离人类主播的水平还差得很远。有评论人士表示,现阶段AI合成主播的宣传和噱头价值远远大于实际应用价值。

    搜狗CEO王小川也曾表达过AI合成主播无法取代人类的观点。王小川说,搜狗于2018年推出的AI合成主播就是在新闻播报领域去替代主播做一些简单的重复性事情,成为主播的一个分身。

    他强调,如今的机器还没有掌握像知识、推理概念的能力,还不具有创造性,在这种层面上机器与人的距离相差很远,机器只能做一些重复性的事情,更谈不上机器取代。

     

    原标题:AI合成主播亮相两会,噱头价值远大于实用价值?