演讲台上站着搜狐董事局主席兼CEO张朝阳与搜狗CEO王小川,会场主视频的一边是明星柳岩,一边是搜狐新闻客户端联合搜狗利用AI技术合成的明星“数字人”柳岩。
真人柳岩与“数字人”柳岩PK当日新闻播报。张朝阳问,谁主持得更好?柳岩由衷地说,它(“数字人”柳岩)主持得更好。
5月17日世界电信日,“2021搜狐科技5G&AI峰会”在北京举行,峰会现场,首个明星“数字人”主播推出。
从1998年成立时算起,搜狐已经走过了23年的历史。23年,搜狐尝试了很多机会,却一直坚持一件事,就是内容创新,包括资讯、视频、社交、游戏等。
互联网颠覆世界是从内容开始的,内容创新这件事,张朝阳干了23年,搜狐还要继续干下去,因为内容创新的空间不是比23年前少了,而是多了。
与23年前相比,内容变革是多方力量合力的结果,媒介电子化更普及,场景更普遍,驱动技术则不再是以前的PC技术,而是面向未来的AI+5G技术。
5G环境下,AI是未来,必须拥抱这样的未来。未来已来,但并不是所有的人都做好了准备,很多人只有拥抱未来的态度,却不知道着力点在哪里。
张朝阳明白:基于搜狐的积累,明星“数字人”就是搜狐的着力点。这是搜狐刺向未来的针尖,集中力量,扎深刺透,就能打开局面,拥有5G+AI时代的未来。
在中国互联网行业,张朝阳爱跑步、爱登山,是个理想化的人,对世界永远保有好奇心,同时也是一个有战略定力,有执念的人,他一直坚持内容创新。
在5G、AI技术的加持下,人类社会正在进入一个全新的时代,明星“数字人”是搜狐新闻客户端对技术创新的又一次探索。
新媒体:明星“数字人”主播让资讯更娱乐
以演员柳岩为原型的主播是首任明星“数字人”,未来将会陆续有其他明星“数字人”主播入驻。观众喜欢谁,就可以选谁做主播。
明星“数字人”已正式在搜狐新闻客户端上线。用户进入“24小时”频道后,点击右上角“收听”图标,即可体验“柳岩”带来的沉浸式视听播报。
点击柳岩的头像,可全屏观看并切换不同方言。此外,在“关注流”中关注账号“柳岩(数字人)”,每天会收到一条柳岩数字人播报的24小时资讯。
明星“数字人”主播除了高度逼真的明星形象外,还能使用多种方言实时播报新闻,让用户更加轻松愉悦地“看新闻”。
随着越来越多的数据支撑,明星“数字人”将会实现识别文本的感情色彩,根据新闻内容和语境,自动对应“喜怒哀乐”情绪、肢体动作和表情。
明星“数字人”甚至可以了解真人的喜好、说话方式,使内容与用户之间的交互变得更加亲切自然,最大化增强用户阅读新闻的体验感。
目前“数字人”已经熟练“掌握”河南话、湖南话、四川话、陕西话、东北话等多种方言,甚至可以在播报同一条新闻中流畅切换。让主持人出道的柳岩都感叹陕西话非常正宗。
“柳岩数字人”不仅形象高度逼真,而且语调抑扬顿挫、动作自然顺畅,无论是简单的动作、细微的唇动,还是招牌性的表情,都与柳岩如出一辙,堪称原版复刻。
怎样才能打造一个如此逼真、如此多才多艺的“数字人”柳岩?
明星“数字人”有如此专业的表现,得益于搜狗的“分身技术”。该技术基于搜狗业界领先的AI能力,仅靠少量真实音、视频数据即可定制出高逼真度的分身模型。
明星“数字人”的重要突破,在于通过创新的语音合成技术,将不同发音人的韵律模型以及音色模型的自由重组搭配,语音播报风格、口音、情感、特色方言等维度能够灵活选择与控制,从而实现抑扬顿挫的韵律节奏和丰富立体的情感表达,让“分身”的语音表达更加真实、更具表现力和感染力。
完成数字人“分身”是一件技术难度高,流程复杂的事情,仅仅为了采集柳岩口音、面部表情、动作习惯等数据,搜狗耗去了整整一天时间。
张朝阳说,很多平台都有虚拟主播,但如此逼真的“数字人”主播,只有搜狐有,原因就是技术有难度,实现很复杂,这是一件有门槛的事情。
按照搜狐的计划,未来将会陆续有其他明星“数字人”主播入驻,用户可以选择喜欢的任何明星,也可以选择自己熟悉的方言。
明星“数字人”主播让媒体更娱乐:随着AI技术的发展,数字人成本的降低,数字人主播会变得越来越好玩,用户可以选择任何人,比如家人、朋友、同学做主播。
全场景:物联网时代的“数字伴侣”
搜狐与搜狗联合推出的明星“数字人”主播不止是一个主播,在未来的物联网时代,在AI技术与5G技术的加持下,“数字人”主播将升级为“数字人”伴侣。
主播是人类在碳基时代的选择,伴侣是碳基智能与硅基智能共处的时代的产物。
最近10年,随着神经网络技术与深度学习的发展,AI技术快速发展,激进地认为硅基智能将取代碳基智能,大多数人则认为硅基智能将与碳基智能共存共处。
无论谁对谁错,硅基智能作为现实世界的一种存在将会越来越强大,人类(碳基智能)必须学会与其共存共处。
科技给人类带来了更多方便,硅基智能与碳基智能如何共处?张朝阳认为,人要坚持自己的信仰和生活方式,不要迷失在科技的丛林里。
“我觉得科技是一个中性的东西,人必须观察自身,同时选择自己一个更加主动的、高效的、舒适的、健康的和有意义的,对人类有进步、有贡献的生活方式。”
硅基智能与碳基智能共存共处将是什么样的场景?比尔盖茨曾预言:未来信息在指尖流动。移动互联网时代,这一预言已经变成了现实。
未来的时代是物联网时代,万物联网时代会怎么样?信息无处不在,任何时间,任何地点,任何设备,更准确地说,是任何场景。
物联网时代也是AI时代,任何场景多会被数据化,被计算,被通讯,被存储,虚拟世界与物理世界无缝融合,物理世界被再造,被重构。
PC、手机是场景的外设,PC互联网、移动互联网对人类的改变还是有限的,AI时代是对物理世界任何场景的改变和重构,这种改变是无限的。
一个可见的例子是车。特斯拉最近风波不断,人们开始反思自动驾驶,但自动驾驶是大势所趋,目前出现的问题是人类必须付出的代价。
人类每一次进步,无不付出了代价,电灯、汽车、火车、轮船出现并普及的过程中,就付出了同样的代价。
自动驾驶会将车这个场景重构,传统汽车是移动的载体,智能汽车是移动生活空间。作为移动目标的人被重新定义了,变成了移动的消费者。
坐在自动驾驶汽车里的人,需要包括媒体在内的各种服务,手机客户端不再是舒适的选择,一个可以投屏的“数字人”会更受欢迎。
可以想象一下:让数字人柳岩讲讲八卦,让数字人乔丹讲讲体育新闻,陪小孩的时候,让数字人孔子讲讲国学,是多么欢乐的场景。
明星“数字人”不再只是一名主播,他是可以进行多重身份切换的“数字伴侣”,随场景切换,随需求切换。
在5G、AI技术的加持下,“数字人”将改变、重构更多的环境,直至整个世界。
互联网时代,媒体从标准化向个人化发展;物联网时代,媒体有反个人化的趋势,会在品质、品味、品格的基础上,在个人化与标准化之间形成新的平衡。
AI时代会有许多新趋势,新的趋势意味着创新的机会,媒体的未来,充满各种创新机会。这是张朝阳看到的未来。
新内容:“数字人”连接“人类大脑”
通信的本质是信息传播,大数据的本质是将物理世界数据化,AI的本质是利用计算的能力基于信息进行决策。某种意义上,AI是云计算、大数据、通信技术发展的集合。
AI为什么这些年迅猛发展?张朝阳认为,是多种技术进步的结果,比如神经网络、深度学习;而神经网络模型、深度学习模型都是特别消耗算力的,必须依赖计算技术的进步,包括从CPU到GPU,从串行计算到并行计算的进步;计算处理的对象数据,因此大数据技术也很重要;数据传输依赖于通讯技术,5G很重要……
张朝阳说:AI迅猛发展,是云计算、大数据、5G等技术协同发展的结果,缺了任何一块都不行。
对于企业来说,这是最好的时代,这些技术都发展成熟了,把所有行业重做一遍的机会又来了。
互联网时代,很多行业被重新做了一遍,比如媒体、零售、游戏、通讯、娱乐,诞生了一批明星公司,搜狐是这个时代的揭幕者,张朝阳因此被称为“互联网教父”。
AI、5G时代,更多行业要被重新做一遍,范围更广、程度更深、势头更猛,其中包括内容行业。
数年前,“媒体行业正在AI化”还是一个观点,现在已经是一个现实,虚拟主播算是萌芽,明星“数字人”是一次进化,但这不是终极形态。
张朝阳认为,AI会让媒体会变得更有趣,更生动,与用户互动更强。比如读一篇文章,读者可以问很多问题,“数字人”可以互动,回答读者的问题。
现在的“数字人”只做简单的新闻播报,未来的“数字人”是智能的,智能的“数字人”背后连着一个巨大的,基于云计算、大数据的知识库。
张朝阳说,媒体未来会变得越来越互动,越来越影像化,越来越智能化,不管什么问题,问明星“数字人”就可以了,数字人直接就能回答用户所有的问题。
这个巨大的,基于云计算、大数据的知识库相当于人类大脑,“数字人”连接着“人类大脑”,无所不知。电商领域有“万能的淘宝”,媒体领域有万能的“数字人”。
在AI时代,“数字人”连接着“人类大脑”,媒体的趋势是垂直化,每一个人在每一个细分领域都有一个自己喜欢的万能的数字人,万能的顾问。
“比如在法律频道,机器学习把所有离婚官司都研究透了,几千万个离婚官司的法庭证词、对讲、财产分割全都学习了,你问任何问题,它都能回答。绝对准确。”
人类获取信息变得更轻松了,不用拿出百度、搜狗搜一下,然后刷一下决定看哪一条,未来明星“数字人”为人服务,没有搜,没有刷。更重要的是,辅助决策解决问题。