apidire推出开源并行优化工具包

初创公司RapidFire AI今日发布了一款开源软件包,旨在简化企业人工智能应用中日益重要的管道开发流程。

该软件包名为RapidFire AI RAG,扩展了该公司的"超并行实验框架",允许开发者同时测试和评估不同的分块配置(将大型文档分割成小片段)、检索技术和提示方案。这些过程通常是顺序进行的,但RapidFire的技术允许多个流并行运行。

评估瓶颈问题

随着生成式AI应用的扩展,开发者正在寻求更稳健的方式来评估和定制性能。联合创始人兼首席技术官Arun Kumar在加州大学圣地亚哥分校任教期间开发了这一并行化软件,他表示,评估指标通常具有领域特异性,有时使用较小的语言模型进行自动化,在过去一年中已经显著成熟。

然而,实际应用并没有跟上技术的步伐。Indico Data Solutions公司首席技术官Madison May在声明中表示:"在企业AI中,困难的部分不是构建管道,而是知道哪种检索、分块和提示的组合能提供可信赖的答案。"

RapidFire AI RAG支持对多个RAG实验进行实时控制、监控和自动优化,即使在单台机器上运行也是如此。系统根据用户是使用自托管模型还是封闭模型应用程序接口,动态分配计算资源或Token使用限制到不同配置中。

RapidFire AI联合创始人兼首席执行官Jack Norris表示,组织往往低估了RAG工作流的复杂性。

"他们不会从基本上是商品化的模型中获得差异化优势,关键在于如何最好地利用他们的数据。"

Kumar表示,许多团队未能考虑到决定模型性能的多个相互作用变量。"人们只是忽视了RAG中存在无数个调节旋钮,"他说。"如何分块数据?如何嵌入?如何检索?如何重新排序?每一个都以非平凡的方式相互作用,并可能影响你的评估指标。"

Kumar表示,据一些估计,90%的RAG原型由于在测试这些变量方面的缺陷而未能投入生产。

超并行化方法

该公司的方法以其称为"超并行化"的方法为中心,这是一种使用共享内存技术在有限硬件资源(如图形处理器)中交换配置的方法。这允许多个实验并行运行,更快地交付结果。

"我们以非常高效的方式自动在GPU中交换配置,"Kumar说。"这基本上允许你在数据分片上获得所有配置的样本。"

系统还支持动态实验控制,允许用户在运行过程中停止、克隆或修改实验。即将推出的更新将增加AutoML支持,用于成本或性能的自动优化。

现已可用

RapidFire AI RAG与用于智能体工作流的LangChAIn框架集成。它支持来自OpenAI、Anthropic、Hugging Face的混合大语言模型、自托管重排器和各种搜索后端。它支持文档预处理和查询处理,并能通过折叠配置间的冗余操作(数据库工程中称为多查询优化的概念)更高效地执行实验。

Norris表示,该工具自一个月前软启动以来已被下载超过1000次,一些设计合作伙伴已在内部测试。现在可通过pip install rapidfireai-rag获取。

该公司计划未来通过高级商业版本和软件即服务产品来实现工具货币化。

"我们现在的重点是开源,让它投入使用,并与Hugging Face等组织合作,"Norris说。

RapidFire AI已从406 Ventures、AI Ventures Management、Osage University Partners Management和Willowtree Investments筹集了400万美元的预种子资金。

Q&A

Q1:RapidFire AI RAG是什么?它有什么特别之处?

A:RapidFire AI RAG是一款开源软件包,专门用于优化RAG(检索增强生成)工作流。它的特别之处在于采用"超并行化"技术,可以同时测试多种分块、检索和提示配置,而传统方法需要顺序进行,大大提高了开发效率。

Q2:为什么90%的RAG原型无法投入生产?

A:主要原因是RAG系统中存在大量相互作用的变量,包括如何分块数据、如何嵌入、如何检索、如何重新排序等。每个环节都会以复杂方式相互影响并影响评估指标,而许多开发团队未能充分测试这些变量组合。

Q3:RapidFire AI RAG如何实现并行优化?

A:它使用共享内存技术在GPU等有限硬件资源中高效交换配置,让多个实验同时运行。系统还支持动态实验控制,用户可以在运行过程中停止、克隆或修改实验,并能自动分配计算资源到不同配置中。

THE END
0.AI软件库AI软件库,致力于发现人工智能生成式AI软件与工具资源,以及stablediffusion,comfyui,midjourney图文和影像视频生成模型animatediff,controlnet,flux,reactor,sd3等与设计模版等ai资源交流学习分享欣赏,涵盖文生图,文生视频,图生图,图生视频,文生三维,图生三维等3d生成技术,aijvzquC41yy}/crfrrm{/exr1
1.AI少女AI少女人物卡工具包Mod6.24—∞下载|3DMMod站在3DM Mod站下载AI 少女最新的AI少女 人物卡工具包 Mod,由四氢呋喃制作。#点点滴在我们的平台上分享了这个免费且高质量的游戏模组,让玩家们可以享受到更加丰富的游戏体验。快来3DM Mod站下载并尝试吧!jvzquC41oqj/5mricok/exr1oqj03@:949
2.AIToolkitforVisualStudioCode入门|MicrosoftLearnAI Toolkit for VS Code (AI Toolkit) 是一个 VS Code 扩展,使你能够在应用或云中下载、测试、微调和部署 AI 模型。 有关详细信息,请参阅 AI 工具包概述。 注意 VS Code AI 工具包的额外文档和教程可以在 VS Code 文档中找到:适用于 Visual Studio Code 的 AI 工具包。 你将找到有关 Playground、使用 jvzquC41nggsp7rketutqoy0eqs0|q2ep1}jpmtyu1gj1}tqnmou1}tqnmou/pjvvkth/|yctvke
3.ai怎么设计箱式手提包素材?Illustrator教程平面设计ai中想要设计一款手提包,该怎么设计呢?下面我们就来看看ai绘制箱体样式手提包的教程,要的朋友可以参考下 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用! 【如果你想靠AI翻身,你先需要一个靠谱的工具!】 ai中想要设计一款手提包,该怎么绘制手提包呢?下面我们就来看看ai设计手提包的教程。jvzquC41yy}/lk:30pku1Rqnwuzsc}tt18;6:?<0jvsm
4.微软据报开发工具包一键转码CUDA,打破英伟达AI生态垄断来源:格隆汇APP 格隆汇11月10日|据美国科技媒体Wccftech,微软为打破英伟达CUDA在AI领域的软件生态霸权,开发出一套专用工具包,可将基于英伟达CUDA编写的AI模型程序码,自动转换为跟AMD …jvzquC41o0ypj~3eqo5b1B:49;6:8Ad344626=74
5.用于语音容器的批处理工具包使用批处理工具包来补充和横向扩展语音容器上的工作负载。 此开放源代码实用程序以容器的形式提供,有助于跨任意数量的本地和基于云的语音容器终结点对大量音频文件进行批量听录。 可在GitHub 和Docker 中心免费使用批处理工具包容器。 你只需要为使用的语音容器付费。 展开表 功能/ 特点说明 批处理音频文件分发 jvzquC41fqit0vnetqyph}3eqo5b|~wg1euhprykxg3tg{{kegy0uyjgej3tg{{keg5trnjej/ipp}fkpgx.djyej/vsqljuukth
6.(6秒快速了解)腾讯天天德州每800字插入交互式AI问答模块(网页3) 场景4:短视频搜索优化 ​​数据​​:抖音搜索日均SEO相关词增长300%(网页9) ​​优化矩阵​​: 短视频标题:嵌入"#手机SEO教程"等话题标签(网页9) 评论区:置顶含核心关键词的解决方案(网页6) 购物车组件:关联《移动端SEO工具包》(网页3) jvzq<84ycr4flA57;0oohx4RqUz03:62a:>63A50JvS
7.「详细教程」基于Algorithmia工具将NLP模型部署为API这意味着,当人们学习机器学习时,很少讨论机器学习部署的话题。因此,许多AI从业者知道如何创建有用的ML模型,但他们发现很难将它们部署到生产中。 毋庸置疑,如果你要使用ML模型,机器学习部署是你应该掌握的比较重要的技能之一。 Model deployment is the process of integrating your model into an existing production jvzquC41yy}/hu~ck0ipo8ftvkimg8<:8
8.Mac版Geekbench6苹果电脑跑分软件让您更精准地评估你的Mac性能Geekbench AI for Mac 苹果系统跑分性能检测工具 永久版下载 5.0分/1人 芯片:Apple Silicone 和 Intel 版本:1.2.0 语言:英文 系统:macOS 13.0 或更高版本 大小:462.4 MB 安装指南 Geekbench for Mac是一款macOS平台的基准测试应用,它旨在通过模拟真实世界应用程序的测试来衡量设备的处理能力,只需按下一个按钮jvzquC41yy}/ojh|n0ipo8Lggmhfplm0jvsm
9.如何使用AIToolkitforVSCode微调模型|MicrosoftLearnAI Toolkit 使用名为QLoRA的方法,该方法结合了量化和低级别自适应 (LoRA) 来使用你自己的数据微调模型。 通过QLoRA:量化 LLM 的有效微调详细了解 QLoRA。 步骤1:配置项目 若要使用 QLoRA 启动新的微调会话,请在 AI 工具包左侧面板中的“工具”部分选择微调项。 jvzquC41nggsp7rketutqoy0eqs0|q2ep1}jpmtyu1gj1}tqnmou1}tqnmou/onpg/zvpn