英伟达发布全球最强芯片,性能暴涨倍!老黄才是这个时代的乔布斯

英伟达发布了全球最强的 AI 芯片。

生成式 AI 已经达到了引爆点。

两个小时的 GTC 2024 大会,更像一场大型演唱会,英伟达高级科学家 Jim Fan 调侃「黄仁勋是新的泰勒·斯威夫特」。

目前英伟达黄仁勋在 AI 行业的地位,大抵就是如此。

去年黄仁勋喊出 AI 的「iPhone 时刻」已经到来,让我们看到了日常生活如何被 AI 改写,而发布会则展示了这个改变的速度正被疯狂加快。

在过去 10 年里,英伟达将 AI 推进了大约一百万倍,远超摩尔定律,或者说英伟达正在书写自己的迭代定律。从芯片算力到 AI 落地,从汽车制造到医疗物流,英伟达在自身进步的同时,也推动了各行各业发展。

摩尔定律已死,可英伟达让新的摩尔定律诞生了。

除了电脑显卡,英伟达在平时很少会被我们感知,但身边许多产品的技术进步又总离不开它们,看完这篇 GTC 2024 的首发总结,或许你能对 AIGC 的浪潮有更明显的感知

18日晚 OpenAI CEO Sam Altman 在 X 发的一条推文或许正是时代的注脚:

This is the most interesting year in human history, except for all future years

这是人类历史上最有趣的一年,但会是未来最无趣的一年。

全球最强 AI 芯片诞生,性能火箭跃升

这是当今世界上生产中最先进的 GPU。

发布会的主角,是「Blackwell B200」AI 芯片,黄仁勋称这颗芯片的名字来自数学家、博弈论家、概率论家 David Blackwell。

基于台积电的 4NP 工艺,Blackwell 架构下的计算芯片拥有 1040 亿个晶体管,比起上一代 GH100 GPU 上的 800 亿个晶体管,实现了又一次突破。

Blackwell B200 并不是传统意义上的单一 GPU,它由两个 Blackwell GPU + 一个 Grace CPU 芯片组合而成,并通过 10 TB/s NV-HBI(Nvidia 高带宽接口)连接,以确保每一颗芯片能够单独运行。

因此,B200 实际上拥有 2080 亿个晶体管,能够提供高达 20 petaflops 的 FP4 算力,其中的两个 GPU 与单个 Grace CPU 相结合的 GB200,可以为 LLM(大语言模型)的推理提升 30 倍的工作效率。

GB200 的性能也将大幅提升,在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,而它的训练速度是 H100 的 4 倍。

更重要的是,与 H100 相比,它可将成本和能耗降低 25 倍。

此前,英伟达的 AI 处理器 H100 尽管十分畅销,然而每块 H100 的峰值功耗高达 700 瓦,超过了普通美国家庭的平均功耗,专家预测,随着大量 H100 被部署,其总功耗将与一座美国大城市不相上下,甚至超过一些欧洲小国。

黄仁勋说,训练一个 1.8 万亿参数模型之前需要 8000 个 Hopper GPU 和 15 兆瓦的功率,如今 2000 个 Blackwell GPU 就可以做到这一点,而功耗仅为 4 兆瓦。

Blackwell B200 GPU 的彪悍性能,从能耗方面也能完美体现。采用了最新 NVLink 互联技术的 B200,支持相同的 8GPU 架构和 400GbE 网络交换机,在性能大幅提升的同时,可以做到与上一代 H100/H200 相同的峰值能耗(700W)。

另外一点值得注意的是 FP4 算力。黄仁勋表示在过去的 8 年里,AI 算力提升了一千倍,其中最为关键的改进是第二代 Transformer 引擎,通过 FP4 算力使计算、带宽和模型大小得到了显著提升。

相较于 AI 常用的 FP8 算力,B200 的 2 个计算芯片让其性能达到了 H100 的 2.5 倍,每个 Blackwell 架构下的芯片算力要比上代 Hopper 芯片高出了 25%。

英伟达高级科学家 Jim Fan 称全新的 Blackwell B200 GPU 是「新的性能野兽。」

B200 在单个架构内的计算能力超过 1 Exaflop,黄仁勋交付给 OpenAI 的第一台 DGX 性能是 0.17 Petaflops,GPT-4-1.8T 参数可以在 2000 台 Blackwell 上 90 天内完成训练。

毫不夸张地说,新的摩尔定律诞生了。

由于 Blackwell 有多种不同的变体可用,因此英伟达还提供了完整服务器节点的规格,主要有三个选项。

首先是最大、最强的 GB200 NVL72 系统,配置了 18 个 1U 服务器,每个服务器配置两个 GB200 超级芯片。该系统内提供了 72 片 B200 GPU,具有 1440Peta FLOPSde FP4 AI 推理性能,和 720 Peta FLOPS 的 FP8 AI 训练性能,并将采取液冷方案,一台 NVL72 可处理 27 万亿个参数模型(GPT-4 的最大参数不超过 1.7 万亿参数)。

另外一个规格是 HGX B200,它基于在单个服务器节点中使用八个 B200 GPU 和一个 x86 CPU,每个 B200 GPU 可配置高达 1000W,并且 GPU 提供高达 18 petaflops 的 FP4 吞吐量,比 GB200 中的 GPU 慢 10%。

最后,英伟达还将推出 HGX B100,其大致规格与 HGX B200 相同,配备 x86 CPU 和 8 个 B100 GPU,只不过会与现有 HGX H100 基础设施直接兼容,并允许最快速地部署 Blackwell GPU,每个 GPU 的 TDP 限制为 700W。

在此之前,英伟达通过 H100、H200 等 AI 芯片使其成为了一家价值数万亿美元的公司,并超越了亚马逊等头部公司,而新发布的全新 Blackwell B200 GPU 和 GB200「超级芯片」很有可能会扩大其领先地位,甚至有望超越苹果。

软件定义一切的时代正在到来

2012 年,一小群研究人员发布了一个名为 AlexNet 的突破性图像识别系统,当时它在猫狗分类任务上的表现远超过了以往的方法,这使得它成为了深度学习和卷积神经网络(CNN)在图像识别领域潜力的一个标志性证明。

也正是借此看到 AI 的机遇后,黄仁勋决定全力押注 AI。有趣的是,以前是识别生成的图片到生成文字,而现在却是通过文字来生成图片。

那么当生成式 AI 浪潮到来,我们能利用它做些什么呢?黄仁勋给出了一些标准答案。

传统的天气模型结合英伟达的气象模型 Cordiff,能够实现探索数百公里甚至数千公里面积范围的预报,提供诸如台风影响的侵袭范围,从而最大程度降低财产的损失。未来 Cordiff 也将向更多国家和地区开放。

生成式 AI 不仅可以通过数字化能力理解图像和音频,同理,也能凭借庞大的计算力扫描数十亿种化合物,从而筛选出新药。

作为一家 AI 军火商,黄仁勋还介绍了专门辅助开发 AI 芯片的 NiMS 系统。在未来,你甚至有机会组建一个 AI 超级团队,将任务拆解为一连串子任务后,就能让不同的 AI 完成检索、优化软件等任务。

未来的设施、仓库、工厂建筑将由软件定义。

无论是人形机器人、自动驾驶的汽车、操纵手臂,这些自主机器人都需要软件层面的操作系统。例如,通过 AI 与 Omniverse 的结合,英伟达打造了一个占地 10 万平米的机器人仓库。

在这个物理精确的模拟环境中,100 个安装在天花板上的摄像机使用英伟达 Metropolis 软件和自动移动机器人(AMR)的路线规划功能,实时映射了仓库的所有活动。

这些模拟还包括对 AI 代理的软件循环测试,以评估和优化系统对现实世界不可预测性的适应能力。

在模拟的一个场景中,AMR 在前往取货盘的途中遇到了一起事故,阻碍了其预定路线。Nvidia Metropolis 随即便能更新并发送了实时占用地图给控制系统,后者计算出了新的最优路径。

仓库操作员还可以通过自然语言向视觉模型提问,模型能够理解细节和活动,并提供即时反馈以改善运营效率。

值得一提的是,本次发布会还出现了苹果 Vision Pro 的身影。企业可以轻松地通过 Omniverse Cloud 将 3D 应用的交互式通用场景描述(OpenUSD)实时串流到 Vision Pro,帮助用户探索前所未有的虚拟世界。

发布会的结尾则是熟悉的机器人环节,正如黄仁勋所说,当他张开双手,与其他人形机器人站在一起的那一刻,此时「计算机图形学,物理学,人工智能的交叉点,这一切都在这一刻开始」。

▲ 小彩蛋

十年前 GTC,黄仁勋首次强调机器学习的重要性,在许多人还在把英伟达当作「游戏显卡」的制造商时,它们已经走在了 AI 变革的最前沿。

在被称为 AI 应用元年的 2024,英伟达早就用 AI 软硬件在众多领域为各行各业赋能:大语言模型、对话式 AI、边缘计算、大数据、自动驾驶、仿生机器人……

药物发现不是我们的专长,计算才是;制造汽车不是我们的专长,造汽车所需要的 AI 计算机才是。坦率地说,一家公司很难擅长所有这些事情,但我们非常擅长其中的人工智能计算部分。

相较于单一行业的佼佼者,英伟达更像是一个「幕后大佬」,只要谈到 AI,英伟达一定是绕不开的话题。

就像老黄说的,英伟达已然是一家平台公司。

正是当年的超前部署、历史发展的大势所趋,让英伟达能在 AI 时代的开端,能够占据 AI 芯片市场 70% 以上的销售额,公司估值也在不久前超过 2 万亿美元。

或许这也是苹果纠结多年后放弃造车、并大力投入生成式 AI 的理由,无论是经济效益还是技术趋势,都太值得豪赌一把了。

在我们还在质疑「AI」有什么用的当下,英伟达用行动证明,AI 已经成为了新时代不可或缺的一部分。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

THE END
0.软件骗局!LearnAI“app”是骗人的平台,各种理由说我操作错误一直四、AI时代防骗指南:如何保护你的数字资产?🛡️ 面对日益精密的AI诈骗,普通用户需要建立系统的防范意识。首先要核实平台资质,通过企业信用信息系统查询注册信息,注意识别PS过的证书截图🔍。正规AI学习平台通常有清晰的商业模式和技术白皮书,而非一味强调"轻松赚钱"。 jvzquC41yy}/lrfpuj{/exr1r19ge?k95e7ghl
1.当艺术遇上AI:AI赋能生产力的可能场景和应用思路AI人工智能费俊老师通过介绍自己曾经主导和参与的三个和AI相关的新媒体艺术项目,解析项目的创作方法,分享自己对“AI时代人类创作者与AI创作者关系”的思考,即在人机协同的时代,人类与机器之间的创造力关系。 第一个项目是《水曰》,即费老师2021年参加武汉东湖生态雕塑双年展的作品。《水曰》以石门峰纪念公园的一座人工湖作为jvzquC41pg}t0|npc0ipo7hp1u~04974/38.3=4fgvgjn6nozyxrm;689<927xjvor
2.李迅雷:AI估值并不便宜,可以找龙头,当下三个低估品种值得投资就当下来讲,我觉得还是要关注人工智能AI对经济的影响。过去我们有过很长一段时间的“互联网+”时代,人工智能不是一个横空出世新的东西,10年、20年前人工智能已经在不少领域得到了广泛应用。 现在全球的关注热点都在Chat GPT上面,今后人工智能的应用领域会越来越广,相当于过去的“互联网+”,现在可能就是一个“人jvzquC41ycrmu}wggvio0lto1cxuklqgu197:A<96
3.著名艺术家一山:关于AI绘画与数字艺术的思考山东站数字化(第一次艺术变革)让绘画走向无纸化、色彩终身化,智能化(第二次艺术变革)让绘画走向替代手工化,绘画从数字化向智能化转变是一个漫长的过程,我们期待着更多的工程师、科学家的软件创新,我们期待一个新的AI时代的到来!我认为我们应该积极的拥抱艺术的新生命,要积极去探索,这种艺术带来了新的无限可能,或许以后jvzquC41uf4djrsc0eun1zquj181295;73532;8243<04><3:296ajqn0jznn
4.2023年通富微电研究报告:VISionS技术护城河与AMD深度合作,在AI随着头部厂商积极将 AI 大模型引入手机,将为手机带来全方位体验升级,有望成为厂商加速产品迭代关键机遇,助力激活消费电子市场新动能,加速智能手机换机周期与行业复苏节奏。 4.3.2 PC:2024 年全球笔电市场有望回暖,PC即将稳步迈入AI 时代 根据IDC 数据,2023 年第三季度 PC 出货量继续螺旋式下降,全球出货量6,820万jvzquC41yy}/xƒpqq0ipo8wgcf532;83349f;
5.全国政协委员走进OPPO:加快AI手机生态标准建设打造通信行业新质“1+N”智能生态体系,推进AI时代加速到来 日前,OPPO联合IDC发布首个AI手机白皮书,提出AI大模型技术将驱动智能手机向AI手机进化,能够充分解放用户的精力和创作力。同时,OPPO还创新性定义了AI手机的四大特征,并且首次发布面向AI时代的1+N 智能体生态战略。 jvzq<84hkpgoen3ept4dp8ijs532;9244>0v;546283:h:488724>90ujznn
6.9年打通校内+校外智能教育全生态一起教育科技赴美IPO“交作业”在线教育进入AI时代 9年内功构筑坚实壁垒 教育信息化还在进阶,在信息、人工智能等技术的加持下,教育智能化已经从纸面概念落地。实际上,现在学生老师普遍使用的口语打分、拍照批改、自适应学习的背后都闪动着尖端技术的身影。 经过多年积累,一起教育科技打造了由海量作业资源和多媒体学习资源组成的本地化内容库,并通过jvzquC41hktbplj0gcyuoxsg{0ipo8f414632:6463=24>7;486/j}rn
7.鸿蒙——即将是国内全部物联网的搭载系统腾讯云开发者社区中国物联网时代,智能家居、智慧城市等领域广泛应用物联网技术。全球 AI 时代助力其发展,鸿蒙操作系统凭借国产化、多设备适配等优势成国内物联网主宰搭载系统,具有开放源代码等特点。jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0c{ykenk04=6778?
8.FPGA在人工智能时代的独特优势本文整理了Doug Burger博士对FPGA在人工智能时代的分析。介绍了暗硅效应,指出FPGA是解决该效应的有效途径,阐述了其独特优势。还讲述了微软的Catapult项目和脑波项目,探讨了实时AI系统的评价标准,最后对AI未来发展进行了思考。 来源| 老石谈芯 作者| 老石,博士毕业于伦敦帝国理工大学电子工程系,现任某知名半导体公司高级jvzquC41dnuh0lxfp0tfv8iSEHQzSM][o5L9tK51ctzjeuj1fgzbkux1::<98A<2
9.飞书是AI时代先进生产力平台,提供一站式协同办公、组织管理飞书是 AI 时代先进生产力平台,提供一站式协同办公、组织管理、业务提效工具 和深入企业场景的 AI 能力,让 AI 真能用、真落地 免费试用 选择你感兴趣的功能 多维表格 飞书aPaaS 飞书aily 即时消息 智能会议纪要 知识库 飞书项目 飞书人事 飞书招聘 立即咨询 jvzq<84hgkyiw7hp1rxjersi
10.为什么是百度连续入选时代周刊百大榜单?百度时代AI作为拥有百年历史、全球影响力最大的新闻周刊之一,《时代》周刊的评选更加关注被选企业或人物的引领性、创新性、影响力等,而不是规模或财富。百度与李彦宏连续入选的背后,正是《时代》周刊对全球AI时代大浪潮的深刻关注,对百度与李彦宏在AI时代浪潮中表现出的专注坚持、创新突破的认可。 jvzq<84hkpgoen3ukpg/exr0ep5uglm1tqrm1;546/66/<61fqi.kwfzeskr8965;37/uqyon
11.剑指人工智能时代英特尔以全栈软硬件实力让AI无处不在英特尔对蓬勃发展的AI时代而言,开发者的重要性不言而喻,在本次英特尔on创新大会上,英特尔也宣布了一系列面向开发者的技术和更新: 首先是英特尔开发者云平台的全面上线,该平台可以帮助开发者利用最新的英特尔软硬件创新来进行AI开发(包括用于深度学习的英特尔Gaudi2加速器),并授权他们使用英特尔最新的硬件平台,如第五代英特尔jvzq<84hkpgoen3ukpg/exr0ep5squq14284/9>/485eql2ko|t{rtn724?23?3ujvsm