可灵数字人来了支持情绪与动作控制轻松打造“有灵魂”的数字角色|数字人生成_AI数字人

近日，可灵AI数字人正式亮相，凭借领先的口型精准度、情绪动作演绎和跨风格泛化能力，重新定义了数字人技术的行业标杆。用户仅需上传一张角色图片、输入角色表达内容或一段音频，就能生成最长1分钟、极具表现力的数字人视频，而且支持多类角色及中英日韩多语种，最低价格仅0.12元每秒，广泛适用于广告、电商、娱乐、媒体、教育等众多场景。目前产品公测陆续开放中。

极简输入、高质输出：一张图实现分钟级数字人生成

可灵AI数字人极大降低了行业的制作门槛，用户只需提供一张角色图（支持写实人物、动漫、动物等多种角色），输入一段文字或音频，即可一键生成最高达1080p分辨率、48FPS高帧率的高质量数字人视频。

该功能可支持生成最长达1分钟的数字人视频，可轻松满足产品讲解、新闻播报、在线教育等多种场景需求，结合会员优惠最低价仅0.12元/秒（标准价格：高品质模式8灵感值/秒，标准模式4灵感值/秒），让高品质数字人技术不再是少数专业机构的专利，真正赋能广大内容创作者与中小企业。

此外，为了实现“开箱即用”的便捷体验，可灵AI还提供了一站式解决方案。既支持用户上传自有素材，也可以使用内置的官方形象库、AI生图功能以及近百种TTS音色，轻松完成从角色创建到配音的全流程。

角色演绎“神形兼备”

在数字人的核心能力——“表现力”上，可灵AI展示了其深厚的技术功底，不再满足于同类产品简单的音画同步，而是追求角色“神形兼备”的生动演绎。

在对口型这一基础指标上，可灵AI数字人展现出了业界领先的精准度。实测案例中，一位女歌手正演唱英文歌曲，其唇形与快速变化的歌词音节完美贴合，复杂口型也表现出色。而根据提示词“眼神专注自信地唱歌”，数字角色更呈现出自信的眼神、持麦的自然姿态，以及与观众互动的微笑，生动还原了歌手在舞台上的表演状态。

同时，凭借可灵视频模型的强大能力，可灵AI数字人展现出优秀的泛化性能，无论是写实人物、动漫卡通、动物形象，皆可生成高质量数字人视频。在卡通猫咪唱英文Rap的案例中，可灵AI精准地捕捉音频节奏，生成了一只一边说唱、一边随节奏自然摇摆身体的“Rapper猫”，跨越不同角色风格界限，赋予角色生命力。

提示词驱动角色表演情绪与动作精细可控

区别于仅“动嘴皮”的数字人，可灵AI数字人还带来了对情绪的深刻理解与表达，而且可通过提示词精细化控制角色情绪与肢体语言，实现“有灵魂的表演”。

在这个表现“愤怒”情绪的案例中，根据音频内容和提示词“内心全是气愤，非常生气”。模型精准地将这种抽象情绪转化为具体的面部微表情——紧锁的眉头、紧抿的嘴唇和充满压迫感的眼神，将角色的内心怒火展现得淋漓尽致。

基于可灵AI视频模型，依托多模态理解大模型与视频生成模型的深度融合，可灵AI数字人突破传统音画同步的表浅拟合，首次实现从「听声音」到「懂意图」的跨越。在口型准确度已达行业领先的基础上，可精准解析输入的语音、图像和提示词，对长视频中数字人情绪、动作与运镜作出精准规划，确保生成内容紧密呼应叙事意图与情感脉络，真正完成从对口型到情节演绎的升级。

技术驱动打造数字人行业标杆

可灵AI数字人的卓越表现，得益于其背后多模态理解大模型与视频生成模型的深度融合。通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理，实现了语音与唇形的精准同步，即使面对多语种、歌唱或极快语速的台词，仍能保证唇形与发音严丝合缝。而采用关键帧控制的架构，模型先构建高层次叙事骨架，再并行生成多个片段的数字人视频，可在保持身份一致的前提下，实现无限长度视频生成。

专业测试中，可灵AI数字人与行业知名产品Heygen及即梦数字人（Omnihuman-1方案）进行了效果对比。结果显示，可灵 AI 数字人在整体效果及多个细分维度上均表现优异，与即梦数字人（Omnihuman-1 方案）对比的整体 GSB 得分达到 2.39，与 Heygen 对比的整体 GSB 得分达到 1.37，位居行业领先。

可灵AI作为全球领先的视频生成大模型，自2024年6月发布以来已完成超30次迭代，用户规模突破4500万，生成视频数量超2亿，为超过2万家企业提供API服务，覆盖广告、影视、游戏等多个领域。随着可灵AI数字人的推出，将进一步降低行业创作门槛、提升制作标准，推动其在短视频、电商直播、在线教育、企业服务等领域的规模化应用。

THE END

可灵数字人来了支持情绪与动作控制轻松打造“有灵魂”的数字角色

音乐里的《数字人生》：人生就是由一堆堆数字组成

湖北作家颜克存：数字人生

可灵数字人来了支持情绪与动作控制轻松打造“有灵魂”的数字角色

林子祥的“数字人生”

数字人教程：全面掌握数字人生成与应用技巧

即梦生成数字人教程指南，让图片“活过来”

年月短视频矩阵赛道重新洗牌：超级智剪稳居榜首，立可为成性价比之王算法ip

从「对口型」到「会表演」，刚进化的可灵数字人，技术公开了动作段落可灵ai数字人图像生成基础模型

“懒人”做口播视频的秘密武器！数字人助手，一键挂机批量生成！

扣子coze实战

上海发布“元宇宙”关键技术攻关行动方案，聚焦沉浸式技术eb技术两大主攻方向

大模型时代，商汤怎么做

你敢信吗et爆款农业短视频，这套黄金搭档工具就够了腾讯云开发者社区

年度关键技术研发计划“元宇宙”项目即将启动申报，来看详情→

年，个普通人年入万以内的创业机会

让开口说话：打造属于你的智能数字人python实现让图片中的人物张口说话