配置工作流以创建音视频智能体智能媒体服务

本文将为您介绍如何快速创建音视频智能体。

为了使用阿里云AI实时互动服务,您需要满足以下条件:

若出现“您当前购买数量超过还可购买的数量余量,请重新选择数量!”,表明服务已经开通。

该节点负责将语音输入转换成可读的文字格式,支持多语种识别。

语言模型:您可以根据您的业务场景,选择不同的语言模型。

基于STT转换得到的文字输入,LLM可以使用大型预训练语言模型来理解和生成自然语言文本。

目前AI实时互动支持您接入通义千问(系统预置)、阿里百炼平台、阿里通义星尘以及自研接入(OpenAI规范)。

阿里云的大模型服务平台阿里百炼是一站式的大模型开发及应用构建平台。选择对接阿里百炼平台提供的语言模型和服务时,您可以选择对接阿里百炼模型中心或应用中心。

阿里通义星尘产品提供定制深度个性化智能体的能力,能够快速创造一个拥有自己独特的人设、风格的智能体,结合数字人语音实时交互能力,可以在指定的不同的场景中进行丰富的互动。

ModelId:目前阿里通义星尘有xingchen-lite、xingchen-base、xingchen-plus、xingchen-plus-v2、xingchen-max五种模型供您选择。

AI实时互动也支持接入您自研的大模型,您可以按照OpenAI规范接入您的大模型。

OpenAI规范:如果您选择按照OpenAI规范接入,您需要填入以下参数:

名称

描述

示例值

ModelId

OpenAI标准model字段,表示模型名称

abc

API-KEY

OpenAI标准api_key字段,表示API鉴权信息

AUJH-pfnTNMPBm6iWXcJAcWsrscb5KYaLitQhHBLKrI

目标模型HTTPS地址

OpenAI标准base_url字段,表示目标服务请求地址

该节点负责将处理后的文本转换回语音格式,以便用户听到系统的响应。

您可以选择适合您应用场景的文字转语音模型,包括:系统预置模板、自研模板、三方插件或百炼。

在TTS节点,您也可以对LLM输入的内容进行过滤。

文本归一化:将文本中的数字、符号等转换为统一标准格式,提升合成语音的质量。如"120°转为“幺二零。

该节点负责生成与处理后的文本和音频相对应的动作、表情和口型同步的数字人视频流。

当前支持在数字人节点中对接数字人插件、对接阿里灵境数字人:

对接数字人插件:

该节点负责从视频中抽取单帧或多帧的图片。

该节点负责识别视频内容中,是否存在特定行为。

基于前置节点对数据的处理,MLLM可以对输入的图片与文字进行理解,生成自然语言文本。您也可以通过选择不同类型的模型来控制模型的输入。

目前AI实时互动支持您接入通义千问(系统预置)、阿里百炼平台、阿里通义星尘以及自研大模型。

阿里云的大模型服务平台阿里百炼是一站式的大模型开发及应用构建平台。选择对接阿里百炼平台提供的语言模型和服务时,您可以选择对接阿里百炼模型中心或应用中心。

在创建智能体应用时,您需要选择多模态大模型qwen-vl-max或qwen-vl-plus,否则无法发布视频类型智能体。

通义星尘产品提供定制深度个性化智能体的能力,能够快速创造一个拥有自己独特的人设、风格的智能体,结合数字人语音实时交互能力,可以在指定的不同的场景中进行丰富的互动。

ModelId:目前通义星尘有xingchen-lite、xingchen-base、xingchen-plus、xingchen-plus-v2、xingchen-max五种模型供您选择。

AI实时互动也支持接入您自研的大模型,您可以按照OpenAI规范接入您的大模型。

OpenAI规范:如果您选择按照OpenAI规范接入,您需要填入以下参数:

名称

类型

必填

描述

示例值

ModelId

String

OpenAI标准model字段,表示模型名称

abc

API-KEY

String

OpenAI标准api_key字段,表示API鉴权信息

AUJH-pfnTNMPBm6iWXcJAcWsrscb5KYaLitQhHBLKrI

目标模型HTTPS地址

String

OpenAI标准base_url字段,表示目标服务请求地址

单次调用图片数上限

Integer

由于部分多模态大模型单次请求可接收图片帧数量有上限,您可以设置此参数来适配不同的大模型。在请求您的MLLM服务时,会自动按照该值对视频进行抽帧采样。

15

单击保存,完成音视频工作流创建。

配置基础信息,绑定音视频类型实时工作流。

绑定具体的音视频工作流,AI智能体将遵循工作流运行。

AI实时互动依赖于ARTC应用,ARTC应用作为通信桥梁,确保对话功能的正常运作。

当您绑定的工作流类型为语音通话时,可以在高级功能配置中上传自定义形象,以便在语音通话场景中展示该形象。

单击提交,完成音视频智能体创建。

消息对话智能体创建完成后,您可以通过扫描体验二维码来进行智能体的体验。

请使用钉钉、微信或浏览器扫描二维码,或将体验地址复制到浏览器中,以体验H5版本的Demo。

Region ID:智能媒体服务控制台上工作流、智能体所在区域。

地域名称

Region Id

华东1(杭州)

cn-hangzhou

华东2(上海)

cn-shanghai

华北2(北京)

cn-beijing

华南1(深圳)

cn-shenzhen

新加坡

ap-southeast-1

ARTC应用的AppId和AppKey

关注阿里云公众号或下载阿里云APP,关注云资讯,随时随地运维管控云服务

THE END
0.扣子(Coze)搭建一个AI智能体AI智能体是一个动态的系统,需要持续学习和改进。通过分析用户数据和反馈,不断更新和优化模型和算法,以提高智能体的质量和效果。 综上所述,使用扣子搭建AI智能体可以帮助我们快速实现对话式AI应用,并且通过合理的设计和实施,能够提供一个功能强大且用户友好的智能体解决方案。jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1::622?3
1.AI智能体创建指南:史上最全教程,手把手带你搭建快速创建智能体 进入文心智能体平台AgentBuilder ,如果你已经想好要创建什么智能体后,点击创建智能体后,会进入到快速创建智能体页面,在当前页面,可以根据引导创建属于自己的智能体,为智能体生成名称、简介、开场白、指令、引导示例等,如下图,接下来我们一步一步进行讲解。 jvzquC41dnuh0lxfp0tfv87623e97<<73770c{ykenk0fnyckny03=<85;:25
2.手把手教你3分钟打造AI智能体:1秒下载+改写抖音文案,效率直接拉满昨天给大家讲述了关于AI智能体的概念、特征、案例及应用(一文读懂人工智能智能体:开启智能新时代),今天咱们就具体做个小的演练,看看智能体到底是怎么给工作赋能的。 比如我们现在都离不开抖音或者视频号的创作,所以无论是为了学习借鉴优秀案例,还是进行二次创作,能够自动下载抖音视频并改写文案都能大大提高工作效率。jvzquC41zwkrk~3eqo563>>52;<978855;869><
3.跟着我的步骤,轻松打造出AI智能体简介:跟着我的步骤,轻松打造出 AI 智能体 crewAI 是一个开源框架,可以编排角色扮演的 AI 智能体,通过促进协作使这些 AI 智能体无缝衔接,处理复杂问题。了解详情,可点击此链接。 本文采用的 crewAI 版本为v0.22.5,废话不多说,直接盘它。 安装 pip install crewai jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1::98:<5
4.如何构建高效AI智能体工程智能体搭建框架可以帮你快速入门,但在转向生产环境时,不要犹豫,减少抽象层,用基本组件进行构建。遵循这些原则,你就能创造出不仅强大,而且可靠、可维护并受用户信任的智能体。 附录1:实践中的智能体 我们与客户的合作揭示了 AI 智能体在两个特别有前景的应用场景。 jvzquC41dnuh0lxfp0tfv8lqpipju~fpnk5bt}neng5eg}fknu527;7798<1
5.手把手教会你搭建属于自己的智能体智能体搭建本期为大家介绍如何搭建自己的智能体,本期用到的工具是扣子(Coze),Coze 是一个由字节跳动推出的 AI 开发平台,主要用于快速构建、调试和部署基于人工智能的对话机器人(Bot)和智能体(Agent)。它类似于其他低代码/无代码 AI 平台,但更注重灵活性和扩展性,支持用户通过可视化工具或代码深度定制 AI 应用。 jvzquC41dnuh0lxfp0tfv8u{vjuo3;8678e0c{ykenk0fnyckny03==626<6:
6.【AIAgent系列】【MetaGPT多智能体学习】3.开发一个简单的多【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1:9;2572
7.个性化AI新体验:豆包AI智能体,让你的声音成为主角!还记得之前推荐过的豆包AI吗?现在她又能整活儿了。 通过创建自己的AI智能体,我们能进行语音克隆。目前还处于免费且没有次数限制的状态,有需要的小伙伴赶紧体验啦! 一、创建AI智能体 下载登录后,在首页可见一个「+创建AI智能体」的按钮。 进入声音选择列表,找到下方的「+创建我的声音」。随后,系统提示你录制声音jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0pn|u138:::53
8.豆包如何创建智能体豆包如何创建智能体 豆包作为一款功能强大的AI智能体创建工具,为用户提供了便捷、高效的智能体生成体验。无论是想要一个陪伴聊天的伙伴,还是一个协助工作的助手,豆包都能满足你的需求。下面,我们将详细介绍如何在豆包中创建智能体。 一、使用豆包自带的AI智能体生成器jvzquC41i0vdqwqkpg4dqv3ep1~03B9813?58@:630nuou
9.豆包如何创建智能体豆包创建智能体的方法豆包app作为一款集成了ai技术的智能助手工具,为用户提供了多种创建个性化ai智能体的方法。无论是想要一个日常生活中的得力助手,还是专业领域的智能顾问,豆包app都能帮助你轻松实现。以下是如何在豆包app中创建智能体的详细步骤。 方法一:通过对话框页面创建ai智能体 jvzquC41o0isut~0eqs0|r}wp1=78;>50jznn
10.天工AI如何创建智能体天工AI如何创建智能体 在人工智能快速发展的今天,天工AI作为一款功能强大的智能工具,正以其便捷性和高效性受到广泛关注。天工AI允许用户快速创建个性化的智能体,以满足各种实际需求。本文将详细介绍如何利用天工AI创建智能体的步骤。 一、访问天工AI平台 首先,用户可以通过多种方式访问天工AI平台。PC端用户可以直接访问[jvzquC41yy}/rltpnktf0lto0et0cr43;7=03B:984670qyonAge?B86:
11.AI智能体实战扣子Coze搭建AI智能体,小白手册coze使用手册本文介绍了如何使用 Coze 搭建 AI 智能体的步骤,包括创建智能体(登陆平台点击 “创建智能体” 并填写信息)、编写提示词(选择运行模式和大语言模型,填写并优化提示词)、添加技能(设置开场白)、预览与调试、发布智能体(填写发布记录选择发布平台)以及使用智能体(查看和测试)。jvzquC41dnuh0lxfp0tfv8vkwhu0c{ykenk0fnyckny03=<77473;