元始于卯·人篇|助力“数字人自由”,新华智云靠什么训练真人

AIGC浪潮下,机器有了可以与人沟通的“智慧”和“灵魂”,数字人技术则提供了机器与人交流时的“外形”和“样貌”。于是,“数字永生”便有了可能。

这是新华智云副总裁周劼人的视频片段,请问,视频中的周劼人 是真人还是数字人呢?事实上,她是从外形到声音完全由AI制作而成的数字人。

众所周知,数字人已经成为链接数实世界的纽带,也是我们进入元宇宙的关键入口。IDC在《中国AI数字人市场现状与机会分析,2022》报告中预计,到2026年中国AI数字人市场规模将达到102.4亿元。

浪潮之下,依托AI技术驱动的数字人,将成为未来数字人市场的主流。

当下,数字人制作和运营高昂成本,制约了市场规模的扩大和应用落地。如何从建模、驱动、渲染等多方面降低数字人成本,提高制作效率,是目前各行各业入驻元宇宙首要考虑的因素。

随着ChatGPT浪潮掀起,沉寂已久的AI再次成为热门话题,并理所当然地成为了数字人“降本增效”的有利武器。

新华智云是国内较早投身数字人的科技公司之一,2019年便试水数字人,开创了新闻领域实时音频与AI真人形象合成的先河。2020年的地方两会报道中,有7省的两会报道使用新华智云虚拟主播。截至2023年2月,超过500家媒体、政府机构、金融机构、会议会展企业使用新华智云虚拟主播。

得益于多年MGC(机器生产内容)和数字人技术储备,新华智云如今已具备AI全链路生产数字人的能力,AI训练出的数字,不仅外形逼真,类型多元,而且生产速度不断加快,成本日渐降低,应用场景越发全面。

借助AI让各行各业实现“数字人自由”,已成现实。

AI自动生成的不同数字人类型

“真”——以假乱真的2D仿真数字人

纵观当今数字人市场,2D仿真类数字人最为常见。前文视频中周劼人数字形象就属于典型2D仿真数字人。仿真,仿真,自然绕不开“真不真”这一关键问题。

2018年,新华社推出全国首个AI合成虚拟主播,经过几年发展,以“华智云”为代表的AI新闻主播、AI金融客服等2D仿真数字人在市场上屡见不鲜,但衡量标准却始终如一——就是一个“真”字。

这几年,国内外各大科技企业都在想方设法地从外形、表情、声音和动作等方面追求极致逼真,以真正实现1:1复刻,或者真人“克隆”。

其中,有企业训练的数字人逼真程度很高,但价格在几十万元到上百万元不等;有的可能省时省力省钱,但训练出的数字人太过机械,逼真度和灵活度都不尽如人意。

新华智云数字人恰恰就居于两者之间,借助AI能力,万元级别的价格,就能达到足以乱真的效果。

新华智云数字人制作平台(移动端)

基于深度学习模型、动作模拟、情感模拟等智能科技,只需采集2-5分钟的真人视频,AI最快训练1小时,即可生成形象逼真、表情到位、口型匹配的数字分身。

相比过去,现在数字人面部精细度更高,发音和口型更精准,肢体动作更自然,而且数据采集时间缩短75%,训练速度更是提高约100倍。

越接近真人外形的数字人,越能提供更亲切、自然、高效的服务体验,让人产生信任。因此,2D仿真类数字人往往适合社交、媒体、金融、电商直播、教育等需要“多交流”“高互动”的场景。数字人可以“扮演”主持人、新闻主播、金融客服、导购员、讲解员、直播博主、老师等角色。在新华智云数字人制作平台中输入文字,一段由数字人播报和讲解的视频,就可以快速生成。

新华智云数字人制作平台(PC端)

此外,接入不同的对话模型(如Chat GPT),数字人还可以实现面对面交流,让人机交互更真实。平台中的换背景、换绿幕等功能,也可以满足不同客户的个性需求。

“像”——一图即得3D写实数字人

2D数字人好在逼真,但终究还是“纸片人”。在虚拟偶像“筱竹”“柳夜熙”大行其道的年代,3D写实数字人也是不少场景的新需求。

与制作纯虚拟数字人的企业不同,新华智云将目光聚焦于如何用更“省”成本的方式,打造更“像”的虚实融合型数字人。

新华智云数字人制作平台自动生成的3D写实数字人视频

提供一张真人正面照片,上传到新华智云数字人制作平台,即可生成一个具有真人五官特点的3D写实数字人。新华智云充分发挥AI技术优势,优化数字人生产流程,缩短制作时间,大大降低了数字人制作成本,将原来动辄几十万元的3D写实数字人价格压缩至千元级。

通过算法训练及优化、多模态信息识别等技术,数字人表情、动作更加生动和细腻,可以满足喜怒哀乐等面部表情和其他动作变化需求。如对声音有要求,还可以复刻真实声音。新华智云在控制成本的前提下,一定程度上保证了数字人的相似度。

目前,3D写实数字人主要应用于数字人新闻播报、直播、文旅等场景。

文旅场景-AI生成的3D虚拟古装形象

其中文旅场景的应用以游客扫脸生成3D形象为典型,结合文化数据资源,通过文化挖掘与智能交互等技术,增加了文化的互动性和有趣性,让数字人走入寻常百姓家。2022年深圳文博会上,让游客数字分身入画的“新华智云数字文化互动长卷”,在现场就吸引了不少游客参观体验。

“轻”——无限畅游的3D轻量版数字人

实时显示3D数字人非常“吃”本地硬件性能,一般手机要保持运行流畅,在一个画面中最多同时出现五个3D数字人,这显然无法满足大访问量和多人要求的商业场景。

因此,新华智云推出3D轻量版数字人,正好满足了这方面需求。它可以通过轻量级Web引擎运行,不仅渲染速度快,成本低,而且支持上百人同框畅游,可通用于各种元宇宙空间。

钉钉企业展厅中的数字人

在元宇宙空间,用户可以基于已有的虚拟模板,根据自身喜好“捏出”人物的五官和妆容,借助AI技术,还可以选择虚拟衣着鞋履、虚拟配饰等,创建个性化的虚拟化身。

此外,用户还可以自由操作虚拟化身,在元宇宙空间中自由移动、跳跃,参与元宇宙社区的游览、社交、游戏及其它娱乐活动。新华智云打造的红旗元宇宙社区、钉钉企业展厅等虚拟空间,都配有这类数字人服务,并且设置了相应玩法,带来更好的元宇宙体验。

不久前,刚获5600万美元融资的初创公司Ready player me做的就是这个“生意”。

不过,比Ready player me更“厉害”的是,新华智云3D轻量版数字人还支持真人复刻。只需上传照片,就能生成五官相似的虚拟化身。这意味着在未来元宇宙里,用户将有可能通过辨认数字人的五官来判断每个人的现实角色,这会带来更加沉浸式地元宇宙体验,进一步加强虚拟与现实的连接。

结语

2022年12月,财经大V吴晓波预测“2023年每一家公司都可能需要一个数字人”。2023年初,ChatGPT等语言模型的接入又为数字人注入强大的“AI大脑”。AI数字人的商业价值已日益凸显,并成为各行业打造竞争优势的重要力量。

因此,新华智云将全面开放所有类型的数字人API,只要获得授权许可,就可以接入任何元宇宙平台或语言模型。无论是基于服务场景使用的智能客服、新闻主播等服务型数字人,还是为了营销使用的品牌虚拟IP,都可以通过新华智云数字人能力在元宇宙场景中大放异彩,带来更优质、更便捷的交互体验。

新华智云数字人“小云”与真人进行对话

未来,新华智云AI全链路生产数字人的能力,将提升数字人的制作效率,低成本推动数字人大规模应用落地,为政企事业、品牌、机构创造更大的价值,助力实现数字人自由。

新华智云,是由新华网和阿里巴巴合资成立的 国有文化数字科技企业,参与组建国内首个媒体融合国家重点实验室,首提MGC (机器生产内容)概念, 并研发国内首个媒体人工智能平台“媒体大脑”和首个数字化文旅融合平台“文旅智能传播平台”,旨在用人工智能等数字技术为媒体、文旅、会展赛、金融、体育等行业赋能,助力相关行业更好地生产优质内容,提升传播红利,被誉为“懂内容的技术公司”。

THE END
0.你知道什么是AI数字人吗?一文带你全面了解!00:00/00:00 你知道什么是AI数字人吗?一文带你全面了解! 发布于:广东省 2024.12.13 10:21 在科技日新月异的今天,AI数字人作为新兴技术的代表,正逐渐走进我们的生活。数字人应用场景广泛,涵盖文娱、传媒、金融、教育等多个领域,正逐渐成为数字经济发展的新增长点。 +1 首赞 评论 收藏 分享 深圳优秘智能 406文章 0阅读 +订阅 相关推荐jvzquC41yy}/uxmw0eun1j4:58932B>;a382;?6::6
1.数字人在不同行业的具体作用是什么?全面解析与最佳实践指南!数字人在不同行业的具体作用是什么?全面解析与最佳实践指南! 深度解析数字人在金融、教育、医疗等行业的实际应用与真实案例,提供权威的数字人推荐与选择指南,助企业高效落地AI数字人解决方案。 引言:数字人不是“花瓶”,而是“生产力革命” 当一位银行客户在深夜咨询理财方案时,数字客服能立即响应;当一名偏远地区的jvzquC41yy}/lrfpuj{/exr1r1gc7n9652i3d:
2.什么是“数字人”?基于AI的无障碍金融服务什么是“数字人”?基于AI的无障碍金融服务 6月底,广西金融科技创新监管实施工作组公示了广西首批创新应用项目,共有2个项目纳入监管,分别来自桂林银行和工行广西分行。 近期,山东、甘肃、湖北、贵州、大连、新疆、山西、广西、陕西、安徽、福建、河南等多地先后开始征集当地金融科技创新监管应用。目前,山东、湖北、贵州jvzquC41yy}/oyf{rcyt0lto0et0pn|u146339<137757<7;0jznn
3.数字人,是风口还是骗局?老叶旗下的菲音数字人制作工具,就是起到了这个作用,它降低创作门槛,把更多人的“解放”出来,让大家有更多的时间去想象“我要什么,更应该做什么”。想清楚后,再通过AI的帮助,去完成要做的事。并且,在此过程中产生的内容,还可以回到AI继续对其训练,让它可以在今后更好更快地解决类似的问题。 jvzquC41dnuh0lxfp0tfv8~gnnux|o81ctzjeuj1fgzbkux135;73>57:
4.元始于卯·人篇AIGC助力“数字人自由”,新华智云靠什么?  AIGC浪潮下,机器有了可以与人沟通的“智慧”和“灵魂”,数字人技术则提供了机器与人交流时的“外形”和“样貌”。于是,“数字永生”便有了可能。 0:00 /0:00   这是新华智云副总裁周劼人的视频片段,请问,视频中的周劼人是真人还是数字人呢?事实上,她是从外形到声音完全由AI制作而成的数字人。jvzq<84yyy4ykwmwcpku0lto1iuoi‚n142842;7:16jchok3g7965=g5dd693n54;6=d7A62e1i/j}rn
5.虚拟数字人,从偶像走向平民其中,商汤将L4和L5等级的虚拟数字人统称为“AI数字人”。“他们”不仅具备高度的拟人化呈现,在形象、动作和智力层面都更接近于真人水平,能够听懂、看懂、有记忆、自学习、与人进行自然交互;同时,在制作流程中也融合了大量的人工智能算法技术来提升虚拟数字人的生产效率,降低虚拟数字人的制作成本。只有达到L4级别及以上jvzq<84yyy4co{tpnktf0lto0et0kwigz0virHr?eqtugwy(e?oofn}(c?yiq€+ecvoe?;8(kfC7;=8
6.刘强东数字人下场带货,京东云秀AI实力反观刘强东数字人,据京东云言犀团队介绍,“采销东哥”AI数字人为完全的AI驱动的大姿态数字人,通过小样本的演讲及日常交谈的影音素材训练而成,带货时的脚本则为AI学习丰富的商品等信息一键生成。全面升级的言犀数字人引入了直播中控台,如同言犀数字人的“大脑”,能实时监测和调整直播间商品库存变化,调整直播话术,比如跳过jvzq<84vgen/eww0ep5uglmrj1814=56395u49762678a>7888?47A3ujvsm
7.2021年虚拟数字人大盘点:柳夜熙AYAYI华智冰都是谁?从技术层面来看,龚俊数字人处在行业领先水平。在外表呈现上,百度引入了4D扫描技术捕捉真人说话以及日常表情的面部细微变化,做到对龚俊真人的超写实还原。语音交互上,百度App语音搜索的识别准确率已经达到98%,还能识别中英文混杂、生僻字、方言等各种语音对话。依托TTS技术,龚俊数字人借由AI合成的声音无限接近于原声,为用户jvzquC41hktbplj0gcyuoxsg{0ipo8f142823;7:44897>=;484ivvq
8.AI数字人直播是什么?如何应用到视频直播间呢?随着科技的飞速发展,数字人AI技术得到了飞跃提升,越来越多的数字人开始出现。那么,究竟什么是数字人呢? 数字人指的是用数字技术创造出来的一个虚拟人物形象,它可以生成克隆真人数字人和3D数字人,人们可以利用这些生成的虚拟形象,在虚拟世界进行交流和展示自己。 从应用角度区分,数字人分为两种。一种是身份型数字人,如虚拟偶像;还有一种是服务型数字人,jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0pn|u1371597;
9.元宇宙的“42条共识”,全网阅读量超1000万!AI数字人摆脱了肉身束缚,只受到数学规律限制,而数学的世界更抽象,这意味着AI数字人的能力将以数学为边界,而不以物理为边界,它们的未来将发展到什么程度?暂时无法评估,但一旦形成进化态,那将完全颠覆元宇宙。 34 乌合之众的 极乐狂欢:一九定律 技术潮流不可阻挡,人类娱乐化亦不可阻挡。 jvzquC41dnuh0lxfp0tfv8nveqjfz‚4ctvodnn4fgvgjn|4344<:6@7:
10.火山引擎“奇美拉”数字人平台封测开启,字节跳动AI版图再添重磅拼图最近科技圈又传来大动作—火山引擎全新数字人平台“奇美拉”正式启动封闭测试!这款由字节跳动智能创作团队打造的产品,依托火山引擎的AI大模型技术,不仅能生成数字人形象,还能实现图片换装、视频翻译等实用功能。 更关键的是,目前邀测阶段完全免费,预计本月底就将开启公测,正式上线后按使用次数或视频时长收费。这一动作,jvzquC41dnuh0lxfp0tfv8K375:96;77925bt}neng5eg}fknu526B:;63?7