数字人，下一个十亿级赛道算法动捕机器人虚拟人人工智能超级智能|百度ai数字人生成_AI数字人

AI数字人正迈向爆发期，有望成为“下一个十亿级赛道”。

这是不久前位于美国硅谷的风险投资公司a16z（Andreessen Horowitz）给出了的一个判断。

这于AI数字人行业无疑是利好。

根据网红营销中心（Influencer Marketing Hub）的一项研究，31.7% 的品牌认为数字人网红比人类网红更有优势，因为他们“对信息传递有更大的控制权”。另有 29.1% 的人表示，全天候可用是人工智能网红提供的最大优势。

这反映了AI数字人在市场上的认可度。

AI数字人，从最开始的“一眼假”“五官僵”，到现在真假难辨，着实是以势如破竹的速度进化。

Part 01

什么是AI数字人？

AI数字人是一种新兴产物。顾名思义，它是人工智能驱动而成。这就与在抖音平台拥有735.7万粉丝（截至目前）的虚拟美妆达人柳叶熙有着“工艺”上的区别。

柳叶熙抖音截图

先来一段枯燥的解释，区别一下这两种数字人。

从原理上解释，AI数字人是通过深度学习算法，将真人表情动作的细节作为数据收集并学习，来训练数字人完成特定任务，形成驱动模型。这种方法的优势就是通过训练数据和算力，帮助数字人更好地理解和响应人类的指令和情境。所以AI数字人的优化迭代意味着训练数据和算力上的优化。

这与中之人（真人）驱动数字人是有很大差别的。

如果你看过虚拟人苏小妹在《星河入梦》中的灵动剑舞，就能感受到这种技术生成的魅力。

《星河入梦》动捕图和剧照

中之人驱动数字人是将虚拟人物形象关键点绑定在真人身上，再通过动捕设备和摄像头，把真人的表情动作反向赋予虚拟人的骨骼结构中；其优点是动作灵活度高、动作细节呈现更完美，但缺点是制作费钱，需要大量拍摄和后期制作工作，成本较高。

像柳夜熙这样精度的虚拟人，按照最低成本估价在50万元左右，这仅仅是基础的3D建模，还不包括后期人物细节的调整、渲染，动捕演员费用等。

相较之下，AI数字人就很友好，不仅生成费用低，而且制作相对简单，更具有应用的普及性。

Part 02

哪些工具能生成AI数字人？

不仅要“形似”，更要“神似”，AI数字人作为人类形象的模仿和延伸，这是怎么做到的？

“一张图片+一段音频”就可以生成个一个逼真数字人，且能做到音画同步、表情自然。这是AI数字人的一大卖点，着力强调”你可以一键拥有“。

另一种颇为“麻烦点”的生成方式是克隆视频形象。

通常来看，视频克隆生成的形象更加生动一些，需要提供真人视频，不同工具对视频时长有不同要求，如剪映数字人功能10秒视频即可，Colossyan要求至少20秒，硅基智能要求3-5分钟的真人出镜口播视频。

但需要注意的是，像剪映、即梦、HeyGen等属于个人创作者轻量化工具，满足个人创作者追流量的需求；而硅基智能、即创、百度慧播星等是企业级应用，一般满足企业数字人直播的定制化需求，可1：1生物特征复刻真人，在政务服务、商务服务等领域提供专业服务。

AI数字人生成工具发展到现在比较多样。国内有飞影、即创、即梦、百度曦灵、魔珐有言、万兴播爆、商汤如影、闪剪、腾讯智影、必剪studio等；国外有HeyGen、Synthesia、Colossyan、DreamFace、D-ID、Rask等。

在个人创作者轻量化工具中，即梦大师版比较惊艳，依托今年2月字节跳动发布的OmniHuman-1模型，一上市就在全球AI圈掀起了巨浪，支持任意宽高比的图像输入，支持卡通、写实和风格化人物，在歌唱、对话、手势处理等方面表现出色，对口型接近真人，能识别侧脸。

当下很多AI数字人工具只能识别“正面对口型”。

今年5月，腾讯混元推出的HunyuanVideo-Avatar模型也表现出众，支持多风格、多物种与多人场景，包括赛博朋克、2D动漫、中国水墨画，以及机器人、动物等。

可灵最近推出一个多人对话对口型功能比较有特色。可灵可自动识别图片中的人物，并选择人物配音；只是当前不支持多段配音与多角色音轨合并生成，但已可控制具体生成位置，笔者也试着体验了一下。

阿里早前推出的AnimateAnyone和Emote Portrait Alive（简称Emo）两款人物动作和表情生成框架，被整合进通义APP的“全民舞台“AI视频生成功能中，制造了一波一键让人物、宠物跳舞、唱歌的AI视频创作热潮。

笔者尝试生成了两个小视频，效果不是很完美，出现了”恐怖谷效应“，但体验到了AI一键生成的乐趣。

从市场反响度看，HeyGenAVATAR IV应该是当前国内外最好的数字人产品。如果说AI语言模型工具的先驱者是ChatGPT ，AI绘画工具的先驱者是Midjourney，那么AI数字人的先驱者就是HeyGen。

HeyGen可以使用提示词精准控制手势，在超快速说唱歌曲生成上口型匹配几乎完美，提供微表情；支持一分钟的直出影像，画面无任何质量衰减。但缺点是比较贵，基础版每月$29。

笔者用同一图片、同一段对话对比了VisionstoryAI与HeyGen的生成效果，HeyGen更胜一筹，口型对得更准确一些，人物表情更自然。

从生成AI数字人趣味性和艺术性角度来看，DreamFace是个值得推荐的工具。它擅长通过AI生成动态头像和艺术化视频效果。笔者也尝试生成了一个小猫视频，比较好玩儿。

无独有偶，国外也有适合企业用户的AI数字人工具，D-ID适配性就比较高。它的独特优势在于支持119种语言，支持视频翻译功能，帮助用户跨越语言障碍，并提供广泛的视频分析和社交媒体集成工具，特别适合全球营销人员和品牌快速生成内容。

在上面提及的国内企业级AI数字人工具中，魔珐有言“3D数字人可一键生成”上是比较出众的；禅镜单次输入文本量高达4000字，可一键生成视频时长达30分钟的视频；飞影数字人是最早国内平替HeyGen的数字人产品；即创具有专属性，是字节巨量引擎旗下的一站式智能创意生产与管理平台，聚焦于商业化广告内容的规模化生产，主要服务于企业用户和广告主；必剪studio是B站推出的免费工具，重点服务于B站up主。

当前，多数互联网大厂已基于AI大模型进行了数字人布局，AI数字人有望成为大模型商业化变现的有效路径。

Part 03

哪些场景为AI数字人所拥趸？

AI数字人涌入直播间，成为新晋“牛马”，已不是新鲜事儿。

还记得去年“采销东哥”带货直播间1小时不到，成交额超5000万的销售神话吗？今年罗永浩首场数字人直播收获了5500万的佳绩。

对比罗永浩和东哥AI数字人的动作、情绪表现，无疑AI罗永浩更逼真一些，他自然的喝水、随意的手势与真人难分伯仲。经历一年努力，AI数字人生成技术有着不小的进步。

，时长01:09

罗永浩微博截图

直播电商带货无疑成了AI数字人创造“生产力”的重要场景，其“全天候工作”和“降本增效”的特性获得很多企业主青睐。这对自带流量IP、强需求推动的产品更为友好。用“数字人爆改直播间”来形容AI数字人在电商里的际遇并不为过。

广告营销、教育培训、产品介绍、客服人员、科技解说等场景也是AI数字人落地应用的热闹场景。对于一些信息性的内容，用户更在意的是信息的获取，尤其是有一定知名度的知识博主。

最近视频号出现的一匹黑马“硅基大马司”就是这样的一个数字人出镜的IP账号，30天涨粉百万，全网播放量破亿。

但这个数字人本身就是硅基智能创始人，他自身就具有IP效应，其受欢迎与否与“内容的有用性“和”科技解说的通俗易懂”有极大关系。

在传媒行业、文旅行业、影视创作等高情绪场景，AI数字人也有进场，但基本处于“行业尝鲜”阶段，更多是AI创新的名片，难以完成“价值创造的闭环”。这或许是由行业特性决定的，一旦需要情感共鸣与在场互动时，AI就显得”力不从心“了。

但随着字节跳动的OmniHuman-1、Hedra的Character-3等具备整合视听动作能力大模型的流行，AI数字人在短视频娱乐领域很受自媒体创作者欢迎，成为社交媒体内容创作的热门趋势。

AI数字人为社交媒体增添了很多个性有趣的内容，新一波流量潮正在上演。

Part 04

AI数字人真正的难题

在电影《银翼杀手2049》呈现的赛博朋克世界里，主人公K是一个采用未来科技制造出来的复制人杀手，生性沉默、孤僻。但面对爱人乔伊时，他却十分温暖。

《银翼杀手2049》剧照

不过，对于K来说，这给予他极大爱与关怀的伴侣却是一个由家中装置投射出来的虚拟人，看得到却摸不着，这于K而言是一种难以触摸的痛。

缺乏“真实感”一直是AI数字人被诟病的原因，如是否有自己独立的表达，是否能够和人类交流，是否能够学习和创作，是否能感动人、影响人……

AI数字人即便再惟妙惟肖，在俘获用户情感方面也显得有些苍白。

所以，AI数字人当下能解决的更多是效率问题，而不是内容问题、产品问题。“硅基大马司”的现象级传播并不是得益于其应用数字人做主播，数字人只是解放了主播身体，让渡他的劳动做更有价值的内容。

找对AI数字人的应用场景貌似比去苛责他是否能“媲美人类“更具有价值。

据IDC预计，到2026年中国AI数字人市场规模将达到102.4亿元，艾媒咨询预计2025年，中国数字人带动的产业市场规模和核心市场规模分别为6402.7亿元和480.6亿元，是2023年的两倍。

未来，数字人应用有望成为AI产业的重要驱动力之一。

当下，AI数字人的发展还处在早期，还有很多进步空间和落地场景的深挖，但从目前市场对AI数字人的接受度来看，其有望成为”下一个十亿级赛道“也不是一场妄言。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END

数字人，下一个十亿级赛道算法动捕机器人虚拟人人工智能超级智能

数字人“占领”，直播电商大战一触即发

百度智能云发布全球首批数字员工，落地即上岗

百度数字人度晓晓开卖画作，小时赚了万能力高考

·消费活力·新数智｜从概念到落地，数字人走进千行百业

数字人，下一个十亿级赛道算法动捕机器人虚拟人人工智能超级智能

百度数字创作：官网大赛数字人及自动创作平台

数字人用菜谱挑战国宴大厨，百度百家号这档节目很会玩