加入星计划,您可以享受以下权益:
产业图谱
作者:丰宁
算力,顾名思义,是指计算能力。
存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以上,重点行业核心数据、重要数据灾备覆盖率达到100%。算力、存力与运力皆举足轻重,而要论谁最重要,恐怕多数人都会觉得是算力。毕竟,“算力紧缺”的气氛常常被渲染起来。
可以看到,万卡集群的建设正如火如荼地进行着。然而,当拥有如此众多的算力芯片时,它们是否已充分发挥出最大潜力呢?
就目前状况而言,答案似乎是否定的。因为算力的释放并非仅仅关乎 GPU 等算力芯片,而是需要全面考虑数据存储、处理速度、网络传输等多个环节的协同作用。
在此背景下,存力作为算力释放过程中的重要一环,其潜力和价值逐渐受到重视。这时候,或许会有读者发问:存力是否能成为提升算力水平、优化算力利用的关键因素?存力究竟能在哪些方面为算力提供助力?以及,为了更有效地支持算力的提升,存力又该如何发展?
首先,高效的存储能力直接促进了数据处理速度的飞跃。随着大模型训练过程中数据量的爆炸性增长,快速、稳定的数据读取与写入成为提升模型训练效率的关键。存力通过优化存储架构、采用高性能存储介质以及智能数据管理技术,实现了数据访问的低延迟与高并发,极大地缩短了数据处理周期,使得模型能够更快地从海量数据中汲取知识,加速迭代与优化。
其次,存力增强了数据的安全性与可靠性。在大数据时代,数据泄露与丢失的风险日益增加,而强大的存力体系通过加密存储、多副本冗余、容灾备份等机制,确保了数据的完整性和安全性,为模型的持续运行提供了坚实后盾。
再者,存力还促进了数据的高效共享与协同。在大模型研发过程中,跨团队、跨领域的数据合作日益频繁,高效的存力系统能够支持数据的快速传输与无缝对接,打破信息孤岛,促进知识融合与创新。通过构建统一的数据管理平台,实现数据的集中管理、按需分配与权限控制,不仅提高了数据资源的利用效率,也加速了科研成果的转化与应用。
通俗来讲,在人工智能的蓬勃发展进程中,仅仅拥有强大的 GPU 还远远不够。毕竟数据在处理之前,需要先“搬过来”。有数据显示,一个规模达 20 亿的数据集,拷贝准备大约整整 30 天。这就意味着倘若没有出色的存储系统作为支撑,GPU也“巧妇难为无米之炊”。再者,在后续的加密存储以及数据共享等方面,存力皆为算力带来诸多强大助力。
倘若用建造高楼大厦举例子,算力便是高耸入云的建筑主体,而存力则是坚实的地基,只有地基稳固,大厦才能拔地而起。因此,倪光南院士也曾表示,算力中心的计算能力由存力、算力、运力三个因素决定。倪光南院士认为,用广义算力去定义一个算力中心,才更准确。
利用SSD来取代HDD
相比之下,中国的闪存市场占比仅为 20.3%,与全球平均水平和美国相比仍存在一定差距。海量数据的增长,对我国存储提出了更高的需求,先进存力成为了存力的重要发展方向。先进存力主要是指企业级存储中更加先进的存力,其以“大容量、高性能”为基础,以“先进介质、高效架构”为支撑,以“开放生态、绿色低碳、安全可靠”为关键,可应用于更广泛的关键场景的存储能力。
采用先进的存储介质和技术
发展大容量的光存储技术也是一个不错的想法,光存储具有长期保存数据、高容量和低成本等优点,可以作为离线存储或归档存储的选择,释放其他存储设备的空间,提高存力并为算力提供更多的可用存储资源。通过以上多种方法的综合应用,可以有效地提升存力,进而为算力的提升提供坚实的基础和强大的支持。
眼下算力中心兴起的同时,还要建设先进的存力中心。
数与算、存与算存在失衡现象,也导致了数据割裂在不同数据中心中,数据归集难、融合汇聚难、有效治理难、使用加工难、共享流通难,导致算力和应用缺乏有效的高质量数据供给,算力的潜能被抑制,对算力和产业的赋能价值没有充分发挥,数据中心的商业和产业持续正向闭环存在巨大挑战。
中国科学院计算技术研究所作为国内顶尖的科研机构,其在存储技术领域拥有深厚的技术积累和强大的研发实力。该研究所致力于建设先进的存力中心,开展存储技术的研究和开发,包括新型存储介质、存储系统架构、存储算法等方面的研究。通过与企业合作,将科研成果转化为实际应用,为我国存储产业的发展提供技术支持。
清华大学计算机科学与技术系在存储技术领域也有着卓越的研究成果和丰富的教学经验。该系积极参与存力中心的建设,开展存储技术的研究和教学工作,培养存储技术领域的专业人才。同时,清华大学还与企业合作,开展产学研合作项目,推动存储技术的创新和应用。
公众号:半导体产业纵横。立足产业视角,提供及时、专业、深度的前沿洞见、技术速递、趋势解析,链接产业资源,构建IC生态圈,赋能中国半导体产业,我们一直在路上。