如果你想拥有一个数字人,如果你想将文本、文案变成一个视频,或许你可以了解一下D-ID。D-ID是一种基于人工智能技术的视频生成工具,它使用了Stable Diffusion和GPT-3等AI技术,可以将静态照片转换为高度逼真的虚拟数字人,将人像、声音和文字智能合成,并最终从文本输入中创建高质量、高性价比和引人入胜的视频。这里先上一个官方宣传视频,一起感受一下这个产品的酷炫吧!00:46
操作指南
1.进入D-ID页面
通过浏览器访问D-ID,点击左下角的Guest,选择Login/Signup。
点击Create Video按钮,开始制作虚拟数字人视频。使用D-ID生成虚拟数字人视频只需简单三步。
1. 设置主持人(Presenter)
presenter可以根据现有进行合成,也可以根据自己的描述生成一个专属的presenter,下面将对这两种进行介绍。
1)choose a presenter
choose a presenter代表可以从已有的模板中选择一个数字主持人,如下所示。可以在下面中选择一个想要的数字主持人。
当我们对这些数字人都不满意时,想把自己的图像变成数字人,按照如下操作。
①点击add
②添加自己的图片
这里图片目前只支持人脸图片,这里我们以孔子的照片为例,生成一个孔子的数字人。
2)Generate ai presenter
上述模板没有自己需要的形象?也没有合适的图片做数字主持人?那就用语言描述!即通过输入文字来描述一些人物特征,让系统智能生成自己的“梦中”主持人。
2. 设置文案和语言类型,或者上传语音
上传完头像后,在右侧输入想让虚拟数字人说的文案,并选择想要的语言、声音和风格。同时,文本框左下角还有支持试听声音效果、在文案中间添加停顿0.5s和智能优化文案这3个功能。
如果现有的声音都不能满足您的需要,您还可以选择上传一段自定义的声音,用于虚拟数字人视频合成。
3、点击“GENERATE VIDEO”,即可生成虚拟数字人视频。
工具特色
1.融合了AI绘画、AI配音和AI数字人功能,将视觉转换为会说话的化身,生成式AI可在数秒内将您的视觉转换为会说话的化身。2.使用Stable Diffusion和GPT-3等AI技术,可以从文本输入中创建高质量、高性价比和引人入胜的视频。
3.可以从一张照片中生成一个会说话的虚拟主播,口型与音频能精准匹配,真实感极强。
4.提供多种语音和声音选项,用户可以根据需要选择不同的数字人、语音和声音,以生成符合自己需求的数字人视频。
总结
超炫AI工具D-ID,让图片瞬间变身动态数字人视频,让你秒变数字人大咖!快去试试吧!