集成大模型与外部工具创建智能体应用智能体应用大模型服务平台百炼

大语言模型(Large Language Model, LLM)无法直接访问专有知识库或获取实时动态信息。针对这一瓶颈,阿里云百炼提供了智能体(Agent)应用。智能体支持以零代码方式,将大模型与外部工具进行集成,从而扩展模型的能力边界。

智能体(Agent)由提示词(Prompt)驱动,通过协同多种外部能力来完成复杂任务。在接收请求后,大模型进行意图理解和任务规划,自主决策并调用一个或多个外部能力来执行任务,最终整合信息生成响应。

百炼智能体支持核心能力包括:

检索增强生成(RAG):通过连接外部知识库,使应用能基于私有数据回答问题,解决大模型无法访问特定信息的问题。

插件(Plug-in):能调用平台预置的效率工具(如代码执行、图像生成、天气查询等)。

模型上下文协议(MCP):允许将第三方服务封装并接入智能体,智能体可调用这些外部服务来完成特定工作。

组件(Component):允许将其他智能体或工作流应用封装为模块化组件,实现复杂功能的复用。

记忆(Memory):使应用能够跨会话存储和回忆关键信息,实现个性化、连贯的对话体验。

配置应用名称、描述信息、应用头像,点击立即创建。

在应用管理界面,在模型选择器的下拉菜单中选择模型,例如通义千问-Plus-Latest.

创建完成后,在右侧对话框中输入问题进行测试。

阿里云百炼智能体应用支持通过选择模型、优化系统提示词、添加 RAG、调用插件和MCP 服务、启用记忆以拓展能力。

模型是驱动智能体进行思考、推理和决策的核心。百炼智能体支持选择通义千问系列、Deepseek 等官方模型,也支持选择自定义部署的模型。

模型选择

参数配置

最长回复长度:模型生成的长度限制,不包含提示词。允许的最大长度因模型不同有所改变。

temperature:控制生成随机性和多样性,数值越高多样性越强,数值越低一致性越强,取值范围为[0, 2)。

enable_thinking:是否开启推理模式。部分不支持推理模式的模型无法配置 enable_thinking 参数。

系统提示词是为智能体预设的元指令,用于定义其角色、行为准则与能力边界,以确保其在交互中始终保持一致性、可控性和任务合规性。

配置提示词

配置系统提示词为请你模仿《百年孤独》的风格来回答我的问题,以下是效果对比:

无系统提示词:

配置系统提示词

在系统提示词中使用自定义变量(可选)

输入/,单击新增变量,配置自定义变量。

配置完成后,可以单击提示词框上方的自定义变量查看已配置的变量。

再次输入/,使用已配置的变量。

模型上下文协议(Model Context Protocol, MCP)是连接智能体与外部世界能力的关键桥梁,允许智能体调用外部工具。当智能体接收到无法仅凭自身知识完成的任务时(例如查询实时天气),它会调用 MCP 来执行这些任务。

百炼智能体应用支持接入模块化的智能体或工作流组件,实现功能复用。

智能体应用的记忆功能分为短期记忆和长期记忆。

短期记忆是会话中提供给智能体的上下文信息。轮数越多,对话相关性越强,输入长度也会增加。支持记忆的上下文轮数为 0 到 30(0 代表不传递多轮对话记录)。

智能体应用支持多种交互方式,包括文本对话、文本生成、语音和视频互动。

文本对话是智能体应用的核心交互方式,能够提供智能和个性化的多轮对话体验。

文本对话支持两种主要输入方式:

文本输入: 输入文字与智能体进行对话。

文本生成支持配置两种内置变量:

Prompt:用户指令,用来指导应用生成回复。

Files & Images:支持上传文档、图片、视频、音频等多种格式,自动识别类型并分类处理。

自定义变量:传入变量值将替换提示词中对应的变量位置。

计费模式

阿里云百炼与视频云分别产生应用调用的账单。

不推荐使用深度思考模式的模型进行实时音视频对话,会影响对话体验,如DeepSeek-R1、QwQ系列模型

DeepSeek V3 模型不支持视频对话功能。

智能体应用支持语音和视频互动,可以与智能体进行实时语音和视频通话。

通过设置欢迎语、添加预设问题,进一步完善智能体应用体验。

欢迎语:智能体的开场白,帮助营造友好积极的对话氛围。仅文本对话模式支持。

预设问题:预设一系列启发性的问题,帮助快速了解智能体的核心能力。仅文本对话模式支持。

测试样例:预置一组输入数据,配置完成后可快速发起测试。仅文本对话、文本生成模式支持。

应用发布是后续所有智能体应用调用、集成的前提条件。

单击智能体应用管理界面右上角的发布按钮,单击确认发布,即可完成应用发布。

您可以在智能体应用发布渠道页签,单击API调用右侧的查看API,查看通过API调用智能体应用的方法。

单击官方渠道右侧的生成分享链接,可以分享给任意阿里云账号进行登录体验。

可以在应用管理找到已发布的应用卡片,在更多 > 复制应用/删除应用进行删除与复制智能体、修改应用名操作。

通过版本管理功能,可以编辑历史版本描述信息,或选择和使用发布过的历史版本。

如果需要使用该历史版本,请单击覆盖当前草稿,在二次确认对话框中单击确认。

使用快速干预工具

使用快速干预工具,可以及时拦截和处理对话中存在潜在的违规、敏感或不当内容。该工具基于自定义的规则,检测用户输入或模型生成的文本,一旦触发条件就会执行预先设置的干预操作,以此保证智能体应用在与用户交互时保持合规与安全,满足平台审核要求,提供更健康的对话体验。

创建输入话术规则

在干预输入话术面板点击创建输入话术规则,并为规则命名。

通过支持正则表达式的检测方式,将需要识别的违规关键词或短语添加到条件里。您可以设置单独的 AND / OR 逻辑条件组合,使规则匹配更灵活多样。

在触发条件时的回复中输入当用户触发风险内容时,系统需要返回的警示或替代文本。这样一来,违规内容就会被拦截并给予提示性的响应。

创建生成结果规则

若想对模型在回复时可能出现的风险内容进行控制,则可以在干预生成结果面板添加相应规则。

规则以正则匹配为基础,结合多条件的 AND / OR 逻辑来判定文本风险。

在触发条件时的回复中配置好干预后需要返回的安全文本,或者是让系统拒绝输出某些不合规的语言。

配置内容安全策略

智能体应用内置了一套内容安全策略,当大模型生成的内容触发此策略时,智能体应用将拦截全部生成内容,并提示内容存在安全问题。

目前,阿里云百炼仅提供“全部拦截”的风险内容拦截方式,您无需手动配置此项。

智能体功能计费主要体现在以下几个方面:

模型调用

智能体会产生模型调用费用,具体费用取决于模型类型、输入和输出 Token 数量。

知识检索增强

知识检索增强功能限时免费。

MCP

部分官方 MCP 按模型调用计费,如文生图、文生视频、语音合成等 MCP。

部分 MCP 服务涉及第三方 API 调用,使用后可能会产生费用。这部分费用由第三方收取,阿里云百炼不收取费用。

长期记忆

长期记忆的数据存储不收费。

在调用应用进行问答时,记忆体内容会合并到 Prompt 传递给大模型,从而增加 Token 消耗。被记忆体内容占用的Token暂不计费。

数据更新可能存在延迟,模型的支持情况以智能体应用内显示为准。

百炼应用如何计费?

只创建应用不会收费。但如果调用应用进行了问答,则会根据调用的模型类型收取模型调用费用。

RAG 功能额外计费吗?

RAG 功能免费,但检索到的内容作为模型输入,按模型输入 Token 计费。

配置了知识库,但智能体的回答和知识库内容不相关,该如何解决?

首先进行知识库命中测试,查看问题与知识库内容的相似度得分。如果得分较低,请尝试优化检索配置,确保模型优先从知识库中获取答案。

在提示词技能设置中添加限制,要求模型仅基于知识库内容回答,避免使用大模型自有知识生成回复。

如果问题仍然存在,可能是模型本身的特性导致,建议尝试更换其他模型以获得更稳定的输出。

自定义插件是否有超时限制?

是否支持通过 API 创建智能体应用?

关注阿里云公众号或下载阿里云APP,关注云资讯,随时随地运维管控云服务

THE END
0.Qwen3+MCP快速解决今晚吃什么?简介:智能体是一种基于云计算和人工智能的自主决策系统,相比通用AI大模型,更注重场景化适配与垂直领域深耕。本文以“今天吃什么”智能体为例,依托Qwen3多模态能力和MCP动态规划框架,打造个性化饮食推荐服务。从开通百炼平台、创建智能体到设计Prompt和部署MCP服务,最终实现精准美食推荐,解决选择困难问题,将点餐变为一场jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1:;863?1