新为数字人注入“灵魂”,但也伴生风险

张江科学会堂分会场,观众正在体验一款智能健康检测系统。  本报记者  袁婧  摄

三维技术公司Canbeing创始人金文云为客户定制了许多高拟真的数字人。这些在虚拟网络空间里拥有高颜值、高情商以及动人嗓音的智能体,已开始成为网店的金牌导购、新闻平台的金牌主持,或是课后辅导的金牌教师。但随着事业越来越成功,金文云对于数字人的未来产生了一分困惑。

作为科幻迷,金文云牢记美国科幻作家艾萨克·阿西莫夫为确保人工智能(AI)不伤害人类而提出的“机器人三大定律”。在昨天举行的2023世界人工智能大会“AIGC数字人论坛”上,金文云说,我们要确保数字人不跨越“三大定律”。

和其他新技术一样,数字人考验我们能否“用发展的办法解决发展中的问题”的原则。昨天的论坛实际上给了大家一个难得的机会,去梳理AIGC(生成式人工智能)和数字人这两个当下的热门概念,特别思考二者结合会发生怎样的“化学反应”。

不只是以假乱真

首先要厘清数字人的概念。

AIGC数字人研究院高级研究员唐昱佳说,世界上首个数字人是卡通片《超时空要塞》中的女主角。根据片方安排,她“走出”动画片,在现实世界出版了一张音乐专辑,由此让人看到虚拟IP旺盛的生命力。

受技术所限,第一代数字人主要靠手绘。到本世纪初,随着动作捕捉技术的进步,影视作品中出现了3D数字角色,数字人进入第二阶段。到最近10年,因为深度学习算法突破,AI生成的第三代虚拟角色问世,ta们外形更接近真人(可能还有些CG味),可以按脚本讲话做事。

《每日经济新闻》就是这类技术的使用方。他们在新闻直播节目中引入两个数字主持。有些传奇色彩的是,因为太过逼真,而且从未官宣“身份”,以至于开播两个多月后,观众才意识到两个主播原来是虚拟的。再后来,不知疲倦的数字人逐渐成为电商宠儿。有媒体这样报道新一代数字“劳模”——《凌晨的公司空无一人,带货的全是数字人》。

如果数字人的进化到此为止,也不至于让金文云有什么纠结。但ChatGPT的火爆,让形势开始不同。“AIGC赋予了数字人灵魂。”唐昱佳说。

被AI深度驱动

受技术所限,前几代数字人就算不能用“徒有颜值”描述,至少也缺少完整“人格”。根据唐昱佳的研究,数字人有两种驱动类型:一是真人驱动,也就是让摄像头捕捉真人的动作,然后借助软件,将其套用在数字人的形象上,大致相当于给真人蒙一个“数字面具”;其二则是AI驱动,也就是说,数字人并不完全是真人的影子,他可以脱离真人独立运动、说话。

在ChatGPT等大模型诞生前,哪怕是AI驱动,数字人的表现还是不够到位。

优链时代是一家很有特色的3D数字人制作企业,CEO蒋亚洪透露,他们自研了一套算法以及一种特别的相机,只要用它给真人拍照,就可以迅速建模生成接近真人形象的数字分身。目前,他们已把业务落地,比如将游客的数字分身嵌入西湖美景,生成“元宇宙游杭州”视频;或是让数字人做出真人根本做不到的事——后空翻、大灌篮……上传社交媒体得到点赞。

这样的数字人虽属AI驱动型,但只能按照一套预录制的动作库来做动作,看起来有些生硬,而且也没有聪明到可以与人自如交谈。不过,短板可能很快被弥补。金文云表示,AIGC一定会造就出动作生成模型,从而让数字人可以摆脱预录制的动作库,自己生成丰富的肢体语言。更重要的是,大模型还能让数字人在讲话时彻底摆脱脚本。

上月底正式公测的现象级手游《逆水寒》,就首次导入了一种类GPT模型。游戏中,NPC(非玩家游戏角色)能自主和玩家对话、做动作,让许多人大为惊叹。实际上,这种技术完全可以移植到数字人身上,从而使得数字人不仅相貌逼真,连行为也更趋近真实。

火爆中保持冷静

真人般的外貌、真人般的肢体语言,但AIGC加持下的数字人,还有更远大的目标。

创壹科技是国内最具影响力的数字人公司之一,曾创造出顶流网红数字人“柳夜熙”。CEO梁子康昨天说,数字人是通往元宇宙时代的钥匙,而要打通虚实之间的界限,就得让数字人拥有接近真人的情感,“没有情感的数字人,只能做电商主播,根本没什么人会去看。”

目前,创壹科技已在情感仿真方面做了许多工作。梁子康透露,未来3年,他们的目标是打造出一个元宇宙数字人IP矩阵。

更多可马上落地的商业模式已经出现。商汤科技副总裁李星冶表示,他们不久前发布了一款App,普通人用手机自拍5分钟视频,就可以生成数字人,能讲150多种方言和外语。除了满足普通用户外,商汤科技还在推行一个“百变大咖”计划,将为100位意见领袖制作数字分身。

有了AIGC的赋能,数字人有望在以下场景落地——成为娱乐偶像、电商主播,或者在新闻、医疗、教育、法律等专业领域扮演专业角色。总体上,这个市场有望在10年内达到数百亿元规模。甚至,想得更远的唐昱佳认为,随着大模型和AIGC工具的繁荣,未来所有人都会拥有自己的数字分身,“人人都可以实现数字永生”。

金文云的纠结就始于“数字永生”。曾有客户让他开发一个产品,目标是为已故亲人复制一个数字分身。经过慎重考虑,金文云婉拒了,“其中可能有伦理问题。”面对观众,他抛出两个疑问:现实世界中,数字人是否应该被视为具有情感和意识的主体?在社会和法律体系中,数字人该有怎样的地位?

的确,数字人的技术和商业前景让人期待,其安全和伦理风险也值得关注。好在政府和厂商都已关注到了这个问题。李星冶透露,按照监管要求,商汤的数字人技术内嵌了可信安全模块,生成的数字人图片和视频无法导入其他内容,以免被不法分子利用。

AI的发展,恐怕会长期伴随争议,数字人也不例外。可能这会是未来的一种常态。

THE END
0.你知道什么是AI数字人吗?一文带你全面了解!00:00/00:00 你知道什么是AI数字人吗?一文带你全面了解! 发布于:广东省 2024.12.13 10:21 在科技日新月异的今天,AI数字人作为新兴技术的代表,正逐渐走进我们的生活。数字人应用场景广泛,涵盖文娱、传媒、金融、教育等多个领域,正逐渐成为数字经济发展的新增长点。 +1 首赞 评论 收藏 分享 深圳优秘智能 406文章 0阅读 +订阅 相关推荐jvzquC41yy}/uxmw0eun1j4:58932B>;a382;?6::6
1.数字人在不同行业的具体作用是什么?全面解析与最佳实践指南!数字人在不同行业的具体作用是什么?全面解析与最佳实践指南! 深度解析数字人在金融、教育、医疗等行业的实际应用与真实案例,提供权威的数字人推荐与选择指南,助企业高效落地AI数字人解决方案。 引言:数字人不是“花瓶”,而是“生产力革命” 当一位银行客户在深夜咨询理财方案时,数字客服能立即响应;当一名偏远地区的jvzquC41yy}/lrfpuj{/exr1r1gc7n9652i3d:
2.什么是“数字人”?基于AI的无障碍金融服务什么是“数字人”?基于AI的无障碍金融服务 6月底,广西金融科技创新监管实施工作组公示了广西首批创新应用项目,共有2个项目纳入监管,分别来自桂林银行和工行广西分行。 近期,山东、甘肃、湖北、贵州、大连、新疆、山西、广西、陕西、安徽、福建、河南等多地先后开始征集当地金融科技创新监管应用。目前,山东、湖北、贵州jvzquC41yy}/oyf{rcyt0lto0et0pn|u146339<137757<7;0jznn
3.数字人,是风口还是骗局?老叶旗下的菲音数字人制作工具,就是起到了这个作用,它降低创作门槛,把更多人的“解放”出来,让大家有更多的时间去想象“我要什么,更应该做什么”。想清楚后,再通过AI的帮助,去完成要做的事。并且,在此过程中产生的内容,还可以回到AI继续对其训练,让它可以在今后更好更快地解决类似的问题。 jvzquC41dnuh0lxfp0tfv8~gnnux|o81ctzjeuj1fgzbkux135;73>57:
4.元始于卯·人篇AIGC助力“数字人自由”,新华智云靠什么?  AIGC浪潮下,机器有了可以与人沟通的“智慧”和“灵魂”,数字人技术则提供了机器与人交流时的“外形”和“样貌”。于是,“数字永生”便有了可能。 0:00 /0:00   这是新华智云副总裁周劼人的视频片段,请问,视频中的周劼人是真人还是数字人呢?事实上,她是从外形到声音完全由AI制作而成的数字人。jvzq<84yyy4ykwmwcpku0lto1iuoi‚n142842;7:16jchok3g7965=g5dd693n54;6=d7A62e1i/j}rn
5.虚拟数字人,从偶像走向平民其中,商汤将L4和L5等级的虚拟数字人统称为“AI数字人”。“他们”不仅具备高度的拟人化呈现,在形象、动作和智力层面都更接近于真人水平,能够听懂、看懂、有记忆、自学习、与人进行自然交互;同时,在制作流程中也融合了大量的人工智能算法技术来提升虚拟数字人的生产效率,降低虚拟数字人的制作成本。只有达到L4级别及以上jvzq<84yyy4co{tpnktf0lto0et0kwigz0virHr?eqtugwy(e?oofn}(c?yiq€+ecvoe?;8(kfC7;=8
6.刘强东数字人下场带货,京东云秀AI实力反观刘强东数字人,据京东云言犀团队介绍,“采销东哥”AI数字人为完全的AI驱动的大姿态数字人,通过小样本的演讲及日常交谈的影音素材训练而成,带货时的脚本则为AI学习丰富的商品等信息一键生成。全面升级的言犀数字人引入了直播中控台,如同言犀数字人的“大脑”,能实时监测和调整直播间商品库存变化,调整直播话术,比如跳过jvzq<84vgen/eww0ep5uglmrj1814=56395u49762678a>7888?47A3ujvsm
7.2021年虚拟数字人大盘点:柳夜熙AYAYI华智冰都是谁?从技术层面来看,龚俊数字人处在行业领先水平。在外表呈现上,百度引入了4D扫描技术捕捉真人说话以及日常表情的面部细微变化,做到对龚俊真人的超写实还原。语音交互上,百度App语音搜索的识别准确率已经达到98%,还能识别中英文混杂、生僻字、方言等各种语音对话。依托TTS技术,龚俊数字人借由AI合成的声音无限接近于原声,为用户jvzquC41hktbplj0gcyuoxsg{0ipo8f142823;7:44897>=;484ivvq
8.AI数字人直播是什么?如何应用到视频直播间呢?随着科技的飞速发展,数字人AI技术得到了飞跃提升,越来越多的数字人开始出现。那么,究竟什么是数字人呢? 数字人指的是用数字技术创造出来的一个虚拟人物形象,它可以生成克隆真人数字人和3D数字人,人们可以利用这些生成的虚拟形象,在虚拟世界进行交流和展示自己。 从应用角度区分,数字人分为两种。一种是身份型数字人,如虚拟偶像;还有一种是服务型数字人,jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0pn|u1371597;
9.元宇宙的“42条共识”,全网阅读量超1000万!AI数字人摆脱了肉身束缚,只受到数学规律限制,而数学的世界更抽象,这意味着AI数字人的能力将以数学为边界,而不以物理为边界,它们的未来将发展到什么程度?暂时无法评估,但一旦形成进化态,那将完全颠覆元宇宙。 34 乌合之众的 极乐狂欢:一九定律 技术潮流不可阻挡,人类娱乐化亦不可阻挡。 jvzquC41dnuh0lxfp0tfv8nveqjfz‚4ctvodnn4fgvgjn|4344<:6@7:
10.火山引擎“奇美拉”数字人平台封测开启,字节跳动AI版图再添重磅拼图最近科技圈又传来大动作—火山引擎全新数字人平台“奇美拉”正式启动封闭测试!这款由字节跳动智能创作团队打造的产品,依托火山引擎的AI大模型技术,不仅能生成数字人形象,还能实现图片换装、视频翻译等实用功能。 更关键的是,目前邀测阶段完全免费,预计本月底就将开启公测,正式上线后按使用次数或视频时长收费。这一动作,jvzquC41dnuh0lxfp0tfv8K375:96;77925bt}neng5eg}fknu526B:;63?7