数字人,下一个十亿级赛道算法动捕机器人虚拟人人工智能超级智能

AI数字人正迈向爆发期,有望成为“下一个十亿级赛道”。

这是不久前位于美国硅谷的风险投资公司a16z(Andreessen Horowitz)给出了的一个判断。

这于AI数字人行业无疑是利好。

根据网红营销中心(Influencer Marketing Hub)的一项研究,31.7% 的品牌认为数字人网红比人类网红更有优势,因为他们“对信息传递有更大的控制权”。另有 29.1% 的人表示,全天候可用是人工智能网红提供的最大优势。

这反映了AI数字人在市场上的认可度。

AI数字人,从最开始的“一眼假”“五官僵”,到现在真假难辨,着实是以势如破竹的速度进化。

Part 01

什么是AI数字人?

AI数字人是一种新兴产物。顾名思义,它是人工智能驱动而成。这就与在抖音平台拥有735.7万粉丝(截至目前)的虚拟美妆达人柳叶熙有着“工艺”上的区别。

柳叶熙抖音截图

先来一段枯燥的解释,区别一下这两种数字人。

从原理上解释,AI数字人是通过深度学习算法,将真人表情动作的细节作为数据收集并学习,来训练数字人完成特定任务,形成驱动模型。这种方法的优势就是通过训练数据和算力,帮助数字人更好地理解和响应人类的指令和情境。所以AI数字人的优化迭代意味着训练数据和算力上的优化。

这与中之人(真人)驱动数字人是有很大差别的。

如果你看过虚拟人苏小妹在《星河入梦》中的灵动剑舞,就能感受到这种技术生成的魅力。

《星河入梦》动捕图和剧照

中之人驱动数字人是将虚拟人物形象关键点绑定在真人身上,再通过动捕设备和摄像头,把真人的表情动作反向赋予虚拟人的骨骼结构中;其优点是动作灵活度高、动作细节呈现更完美,但缺点是制作费钱,需要大量拍摄和后期制作工作,成本较高。

像柳夜熙这样精度的虚拟人,按照最低成本估价在50万元左右,这仅仅是基础的3D建模,还不包括后期人物细节的调整、渲染,动捕演员费用等。

相较之下,AI数字人就很友好,不仅生成费用低,而且制作相对简单,更具有应用的普及性。

Part 02

哪些工具能生成AI数字人?

不仅要“形似”,更要“神似”,AI数字人作为人类形象的模仿和延伸,这是怎么做到的?

“一张图片+一段音频”就可以生成个一个逼真数字人,且能做到音画同步、表情自然。这是AI数字人的一大卖点,着力强调”你可以一键拥有“。

另一种颇为“麻烦点”的生成方式是克隆视频形象。

通常来看,视频克隆生成的形象更加生动一些,需要提供真人视频,不同工具对视频时长有不同要求,如剪映数字人功能10秒视频即可,Colossyan要求至少20秒,硅基智能要求3-5分钟的真人出镜口播视频。

但需要注意的是,像剪映、即梦、HeyGen等属于个人创作者轻量化工具,满足个人创作者追流量的需求;而硅基智能、即创、百度慧播星等是企业级应用,一般满足企业数字人直播的定制化需求,可1:1生物特征复刻真人,在政务服务、商务服务等领域提供专业服务。

AI数字人生成工具发展到现在比较多样。国内有飞影、即创、即梦、百度曦灵、魔珐有言、万兴播爆、商汤如影、闪剪、腾讯智影、必剪studio等;国外有HeyGen、Synthesia、Colossyan、DreamFace、D-ID、Rask等。

在个人创作者轻量化工具中,即梦大师版比较惊艳,依托今年2月字节跳动发布的OmniHuman-1模型,一上市就在全球AI圈掀起了巨浪,支持任意宽高比的图像输入,支持卡通、写实和风格化人物,在歌唱、对话、手势处理等方面表现出色,对口型接近真人,能识别侧脸。

当下很多AI数字人工具只能识别“正面对口型”。

今年5月,腾讯混元推出的HunyuanVideo-Avatar模型也表现出众,支持多风格、多物种与多人场景,包括赛博朋克、2D动漫、中国水墨画,以及机器人、动物等。

可灵最近推出一个多人对话对口型功能比较有特色。可灵可自动识别图片中的人物,并选择人物配音;只是当前不支持多段配音与多角色音轨合并生成,但已可控制具体生成位置,笔者也试着体验了一下。

阿里早前推出的AnimateAnyone和Emote Portrait Alive(简称Emo)两款人物动作和表情生成框架,被整合进通义APP的“全民舞台“AI视频生成功能中,制造了一波一键让人物、宠物跳舞、唱歌的AI视频创作热潮。

笔者尝试生成了两个小视频,效果不是很完美,出现了”恐怖谷效应“,但体验到了AI一键生成的乐趣。

从市场反响度看,HeyGenAVATAR IV应该是当前国内外最好的数字人产品。如果说AI语言模型工具的先驱者是ChatGPT ,AI绘画工具的先驱者是Midjourney,那么AI数字人的先驱者就是HeyGen。

HeyGen可以使用提示词精准控制手势,在超快速说唱歌曲生成上口型匹配几乎完美,提供微表情;支持一分钟的直出影像,画面无任何质量衰减。但缺点是比较贵,基础版每月$29。

笔者用同一图片、同一段对话对比了VisionstoryAI与HeyGen的生成效果,HeyGen更胜一筹,口型对得更准确一些,人物表情更自然。

从生成AI数字人趣味性和艺术性角度来看,DreamFace是个值得推荐的工具。它擅长通过AI生成动态头像和艺术化视频效果。笔者也尝试生成了一个小猫视频,比较好玩儿。

无独有偶,国外也有适合企业用户的AI数字人工具,D-ID适配性就比较高。它的独特优势在于支持119种语言,支持视频翻译功能,帮助用户跨越语言障碍,并提供广泛的视频分析和社交媒体集成工具,特别适合全球营销人员和品牌快速生成内容。

在上面提及的国内企业级AI数字人工具中,魔珐有言“3D数字人可一键生成”上是比较出众的;禅镜单次输入文本量高达4000字,可一键生成视频时长达30分钟的视频;飞影数字人是最早国内平替HeyGen的数字人产品;即创具有专属性,是字节巨量引擎旗下的一站式智能创意生产与管理平台,聚焦于商业化广告内容的规模化生产,主要服务于企业用户和广告主;必剪studio是B站推出的免费工具,重点服务于B站up主。

当前,多数互联网大厂已基于AI大模型进行了数字人布局,AI数字人有望成为大模型商业化变现的有效路径。

Part 03

哪些场景为AI数字人所拥趸?

AI数字人涌入直播间,成为新晋“牛马”,已不是新鲜事儿。

还记得去年“采销东哥”带货直播间1小时不到,成交额超5000万的销售神话吗?今年罗永浩首场数字人直播收获了5500万的佳绩。

对比罗永浩和东哥AI数字人的动作、情绪表现,无疑AI罗永浩更逼真一些,他自然的喝水、随意的手势与真人难分伯仲。经历一年努力,AI数字人生成技术有着不小的进步。

,时长01:09

罗永浩微博截图

直播电商带货无疑成了AI数字人创造“生产力”的重要场景,其“全天候工作”和“降本增效”的特性获得很多企业主青睐。这对自带流量IP、强需求推动的产品更为友好。用“数字人爆改直播间”来形容AI数字人在电商里的际遇并不为过。

广告营销、教育培训、产品介绍、客服人员、科技解说等场景也是AI数字人落地应用的热闹场景。对于一些信息性的内容,用户更在意的是信息的获取,尤其是有一定知名度的知识博主。

最近视频号出现的一匹黑马“硅基大马司”就是这样的一个数字人出镜的IP账号,30天涨粉百万,全网播放量破亿。

但这个数字人本身就是硅基智能创始人,他自身就具有IP效应,其受欢迎与否与“内容的有用性“和”科技解说的通俗易懂”有极大关系。

在传媒行业、文旅行业、影视创作等高情绪场景,AI数字人也有进场,但基本处于“行业尝鲜”阶段,更多是AI创新的名片,难以完成“价值创造的闭环”。这或许是由行业特性决定的,一旦需要情感共鸣与在场互动时,AI就显得”力不从心“了。

但随着字节跳动的OmniHuman-1、Hedra的Character-3等具备整合视听动作能力大模型的流行,AI数字人在短视频娱乐领域很受自媒体创作者欢迎,成为社交媒体内容创作的热门趋势。

AI数字人为社交媒体增添了很多个性有趣的内容,新一波流量潮正在上演。

Part 04

AI数字人真正的难题

在电影《银翼杀手2049》呈现的赛博朋克世界里,主人公K是一个采用未来科技制造出来的复制人杀手,生性沉默、孤僻。但面对爱人乔伊时,他却十分温暖。

《银翼杀手2049》剧照

不过,对于K来说,这给予他极大爱与关怀的伴侣却是一个由家中装置投射出来的虚拟人,看得到却摸不着,这于K而言是一种难以触摸的痛。

缺乏“真实感”一直是AI数字人被诟病的原因,如是否有自己独立的表达,是否能够和人类交流,是否能够学习和创作,是否能感动人、影响人……

AI数字人即便再惟妙惟肖,在俘获用户情感方面也显得有些苍白。

所以,AI数字人当下能解决的更多是效率问题,而不是内容问题、产品问题。“硅基大马司”的现象级传播并不是得益于其应用数字人做主播,数字人只是解放了主播身体,让渡他的劳动做更有价值的内容。

找对AI数字人的应用场景貌似比去苛责他是否能“媲美人类“更具有价值。

据IDC预计,到2026年中国AI数字人市场规模将达到102.4亿元,艾媒咨询预计2025年,中国数字人带动的产业市场规模和核心市场规模分别为6402.7亿元和480.6亿元,是2023年的两倍。

未来,数字人应用有望成为AI产业的重要驱动力之一。

当下,AI数字人的发展还处在早期,还有很多进步空间和落地场景的深挖,但从目前市场对AI数字人的接受度来看,其有望成为”下一个十亿级赛道“也不是一场妄言。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.如何让龙年生意开门红,百度轻舸为商户当好“春节AI管家”但高质量视频需要专业的拍摄和后期制作,通过首次数字人的拍摄,以及后期利用百度AIGC生成数字人视频,在降低成本的同时也缩短了制作周期。 河北丰泰源沥青:AI助力产品销往海内外 同样坐落在美丽古城邯郸的企业还有河北丰泰源能源科技有限公司,这是一家主营沥青的煤化工生产加工企业,产品远销国内外,实现了内外贸一体化,jvzquC41pg}t0|npc0ipo7hp1u~04976/28.494fgvgjn6npckysmt5;42>627xjvor
1.百度AI数字人市场份额稳居行业第一,百度的优势该咋看?第三,百度AI数字人在多行业的广泛应用是其成功的关键因素之一。无论是金融、教育、媒体还是文旅等领域,百度智能云曦灵都能通过提供开箱即用的SaaS平台、高效易集成的组件平台以及数字人定制服务,满足不同企业的个性化需求。在金融领域,百度在国有大行中,市占率超过50%;在教育领域也能帮助教师快速生成高质量授课视频。jvzquC41yy}/jwyx0v|0pn|u1252;<<279996:9582?97A
2.百度AI数字人希加加亮相全球人工智能开发者先锋大会讲述AIGC新未来百度AI数字人希加加AIGC能力运用分享 动态图【5m以内】 AIGC开启创作新纪“元” AIGC是人工智能的重要领域,近一年成为全球最热科技话题。AIGC是AI Generated Content缩写,即利用AI技术自动生成内容的生产方式,对应互联网 UGC(用户生成内容)、PGC(专业生产内容)等概念。AIGC不仅可以作画,还可用于图文、语音、音频、视jvzquC41pg}t0lsuvqil0lto1pkxu5gymz332;824/;14;:8:0nuo
3.AI送小样,百度搜索挖掘品牌增长新机遇百度百度搜索AI随着AI技术在营销领域的加速渗透,百度通过数字人等Web3.0时代下的营销介质,不断提升品牌链接用户的效能,为品牌打造了更具象想象力的变现场景。 在“有惊喜”首期活动中,百度AI数字人度晓晓就贯穿活动全程,不仅化身好物推荐官,为用户送出免费小样,将实用性与趣味性完美结合。此外,在倩碧与度晓晓联合推出的新品宣传视频jvzquC41pg}t0|npc0ipo7hp1u~04974/2?.2;4fgvgjn6nososujj:88397;7xjvor
4.罗永浩任首席体验官!百度“慧播星”放大招:投1亿再造10万数字人主播6月17日,在百度AI Day开放日上,百度官宣打造业界首个超头主播罗永浩数字人,并发布了高说服力数字人的四大技术突破。此前,罗永浩数字人直播首秀创下超1300万人次观看、GMV突破5500万元的行业新纪录,部分核心品类带货量反超真人直播。 新一代高说服力数字人 引领智能电商新篇章 jvzquC41yy}/l€{kgy4dqv4lkpmxgr4jvor0o858/3>08;97:74tj}rn
5.百度发布2025十大科技前沿发明集群模型数字人此次发布的“2025百度十大科技前沿发明”具体包括:“自回归统一建模的原生多模态大模型”“大模型训练全流程高效容错技术”“剧本驱动的高说服力数字人技术”“基于多智能体协同的AI搜索引擎”“蒸汽机(文心专精)音视频一体化生成大模型技术”“从芯片到集群的跨层级训推一体AI基建系统性技术”“兼容端到端轨迹方案的jvzq<84m0uooc7hqo0io1jwvkerfa>84::;98B8a35j:hnj672812;>32{4ivvq
6.百度AI短剧生成平台启动公测以资金与流量支持创作者生态网经社(网经社讯)10月16日消息,百度搜索宣布,其AI短剧生成平台正式面向公众开放测试。该平台以亿元级别的创作基金和百亿规模的流量资源作为扶持手段,致力于为创作者提供从内容生成到IP变现的全链条支持。 据网经社产业电商台(B2B.100EC.CN)获悉,在技术实现层面,平台提供“自动生成”与“人机协作”两种模式。人工智能可jvzq<84yyy4229je0et0jxrg1fkucrq//8<64B=20jznn
7.免费AI口播数字人app官方下载最新版免费AI口播数字人是一款 AI 数字人口播视频生成工具 输入文字即可一键生成口播视频,帮助你轻松打造个人IP矩阵,实现AI替你打工的梦想! 产品还内置了多个数字人模特,让你轻松实现数字人带货自由。 软件优势 【强大的AI数字人】 接入满血版百度文心大模型,能够让你轻松制作口播视频的应用程序,AI对口型生成视频,让AI说出jvzq<84yyy4ccxggk{4dqv4c|uugv8672;7/j}rn
8.百度发布“共拓计划”:AIGC能力赋能14万客户,视频制作成本下降85%另一位合作伙伴无双科技副总裁周昀在现场分享了无双科技与百度AIGC的共拓方案。对接百度AI营销 API后的无双科技,批量输出AI文案,每日将达500-1000+,AI数字人视频生成,每日将超300-500+条,预期覆盖500+账户。 百度渠道生态合作部总经理王彦丽表示,在商业AIGC产品上线后,已经覆盖了45家优秀的代理商团队,包括核心综合jvzq<84f0{uvvq3ep1~x5?5142842B4v42842B72a3:92:>670nuo