推理进入“毫秒块钱”时代!浪潮信息发布面向智能体优化计算系统

9 月 26 日,在 2025 人工智能计算大会上,浪潮信息公布,基于元脑 SD200 超节点 AI 服务器,DeepSeek R1 大模型 token 生成速度仅需 8.9 毫秒,创造国内大模型最快 token 生成速度;而最新发布的元脑 HC1000 超扩展 AI 服务器,实现每百万 token 成本首次击破 1 元。浪潮信息对 AI 计算架构的持续创新,旨在解决智能体产业化面临的交互速度和 token 成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。

随着 Scaling Law 持续推动模型能力跃升,以 DeepSeek 为代表的开源模型极大的降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值,token 成本决定了智能体的盈利能力。

仅需 8.9 毫秒!元脑 SD200 引领 token 生成速度率先进入“10 毫秒时代”

浪潮信息最新公布,基于元脑 SD200 超节点 AI 服务器运行 DeepSeek R1 大模型,单 token 生成速度低至 8.9 毫秒,带动国内 AI 服务器 token 生成速度率先进入“10 毫秒时代”。

元脑 SD200 基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了 64 路本土 AI 芯片的高速统一互连,单机可承载 4 万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。为实现极低的通信延迟,元脑 SD200 采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。

元脑 HC1000,推理成本首次击破 1 元 / 每百万 token

浪潮信息重磅发布元脑 HC1000 超扩展 AI 服务器,基于全新开发的全对称 DirectCom 极速架构,无损超扩展设计聚合海量本土 AI 芯片、支持极大推理吞吐量,推理成本首次击破 1 元 / 每百万 token,为智能体突破 token 成本瓶颈提供极致性能的创新算力系统。

元脑 HC1000 通过全面优化降本和软硬协同增效,创新 16 卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑 HC1000 通过算网深度协同、全域无损技术,实现推理性能相比传统 RoCE 提升 1.75 倍,单卡模型算力利用率最高提升 5.7 倍。

未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息将通过软硬件协同设计与深度优化,持续推动 AI 计算架构的创新与突破,不断实现 token 生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。

THE END
0.智能计算系统官方网站“作为北京智源研究院智能体系结构方向的首席科学家,陈云霁研究员及其同事编写的这本教材,深入浅出地介绍了当代机器学习计算系统软硬件技术栈的知识,其系统性、全面性在国内外都非常难得,值得每位人工智能方向的同学阅读。” 张亚勤 中国工程院外籍院士 “作者深层次全栈性的解析了 AI 的关键理论和技术,又通过图像风jvzq<84pqxkm0rhv0ci/ew4
1.智能科学与技术学院(筹)关于2021年接收专业型硕士研究生调剂的智能科学与技术学院(筹)由之江实验室承建,中国科学院计算技术研究所(以下简称“计算所”)、中国科学院软件研究所(以下简称“软件所”)等相关科研单位共建,培养“国际化、创新型、复合型、实用型”智能科技领域研究类和应用类人才。 根据2021年招生工作安排,智能科学与技术学院(筹)预计可接收45名电子信息(085400)jvzq<84jkcy/wlfu0ci/ew4kphu039=613>957mvo
2.OPPO发布端侧智能计算、AgentMatrix智能体框架等AI战略00:00:22 中国移动全球合作伙伴大会探讨AI 00:00:35 蒙彼利埃站国乒3人首轮出局,陈幸 00:00:39 OpenAI估值高达5000亿美 00:00:09 东盟峰会女保镖视频在网上火了 在 00:00:39 OPPO AI迎来全新IP形象! 1 2 3 热门视频 1. 9,440 小哥送完外卖站路边 2. 8,312 河北承德jvzquC41xkjfq7xkpc4dqv3ep1v0hrscpek04977/36.3>4fgvgjn6nphvggw726:7967i0jvsm
3.中科曙光加入九源智能计算生态联合体,共建自主AI生态|中科曙光|AI【中科曙光加入九源智能计算系统生态联合体】11月8日,在第七届中国超级算力大会上,“九源智能计算系统生态联合体”正式成立,中科曙光作为常务理事成员单位加入。 该联合体旨在破解硬件堆叠瓶颈,通过软件栈与生态协同推动智能计算体系可持续发展。中科曙光提出的中国首个AI计算开放架构,与“九源”倡导的智能计算系统生态方向jvzq<84m0uooc7hqo0io1jwvkerfa;;82;:1398a;g?bdB9926613tvny0nuou
4.OPPO发布端侧智能计算AgentMatrix智能体框架等AI战略OPPO发布端侧智能计算、Agent Matrix智能体框架等AI战略发现更多热门视频 吴石将军墓前鲜花摆了5米长 未来网7458次播放 老人住院家人来陪护,三人在病床上吃饭的样子逗笑老人! 云边的一朵雾8774次播放 女子从江西远嫁湖南,这就是我当初不顾父母也要嫁的地方 云边的一朵雾6452次播放 刚出生十天的宝宝有多粘人,在舒jvzquC41xkjfq7xkpc4dp8kkpctdg872473226671fkucrq/kplu{ojp42:93A90f0nuou
5.浙江理工大学举办2023医学图像信息与智能计算前沿技术研讨会11月25日,由中国生物医学工程学会医学图像信息与控制分会主办,浙江理工大学科学技术协会、浙江理工大学计算机科学与技术学院(人工智能学院)承办的“2023医学图像信息与智能计算前沿技术研讨会”在杭州举办。副校长郭玉海出席并致辞。 开幕式上,郭玉海代表学校向与会的领导嘉宾、专家学者表示欢迎,并简要介绍了学校的发展概况jvzquC41pg}t0ƒxvw0kew7hp1ktgq86255559><60jzn
6.未来智能:人有人用机有机用新闻频道迄今为止,人工智能(AI)发展的特点是基于逻辑和计算不断迭代,从逻辑智能转向计算智能。逻辑智能的核心是基于逻辑的各种推理方法,专家系统和Lisp机是其发展的高峰。如果说逻辑智能是AI 1.0,计算智能就是AI 2.0,其始于控制论和认知计算,从20世纪80年代中期开始大规模地使用多层神经元网络,一直发展到现在的深度神经元网络jvzquC41pg}t0lhvx0ipo8724351687;1CXUK;7w5OYpOPK4JtMXn9i8z4716;>0ujznn
7.OMDIA云技术正在赋予开发者创建灵活且响应迅速的应用程序的能力,以满足不断变化的内部和外部客户需求。此外,人工智能和生成式人工智能的飞速发展正解锁新的机遇,用于应对复杂、昂贵且资源密集型挑战,例如预测分析和视觉检测。本地计算、云技术和人工智能的融合为IT决策者开创了一个新纪元:AIAnywhere。jvzq<84m0uooc7hqo0io1jwvkerfa>>74;769;5a388e4=>2:2<82;v5e:4ivvq
8.华为在2019汉诺威工业博览会展示创新ICT解决方案,加速工业数字化华为AI 智能计算平台,打造高性能计算与低时延网络结合的边缘计算解决方案 在2019汉诺威工业博览会期间,华为首次在西欧发布了Atlas智能计算平台。华为Atlas智能计算平台基于华为昇腾系列AI处理器和业界主流异构计算部件,通过Atlas 200 AI加速模块、Atlas 300 AI加速卡,Atlas 500智能小站和Atlas 800 AI一体机等丰富的产品形态jvzquC41g0nvc€jk0eun1ls1pg}t1ngi1462;8mwcykj/qfppq|ft6rguuk.496;/ntj/ltppgiukwl/dkzt/jsf/ikbt|