21世纪经济报道记者倪雨晴 深圳报道
在人工智能技术爆发式发展的当下,全球数据规模迎来前所未有的增长。数据从“沉睡的资源”转化为核心生产要素。
而存力中心,则成为支撑这一转化的基础设施。它不仅关乎数据的存储,也关乎AI时代的算力能力、效率和安全。
从“容器”走向“基座”
随着大模型迅速推广、AI场景多模态演进,数据规模进入EB级时代。
在近日“存力中国行”的一场座谈中,中国信通院副院长王志勤向21世纪经济报道记者指出,当前存储已从传统的“数据容器”,跃升为支撑数字经济高质量发展的战略基座,“它是激活数据要素价值、培育新质生产力的核心引擎。”
她介绍道,截至2024年底,全国存力总规模已达1580EB,其中先进存储占比提升至28%。尽管如此,仍存在“存而不用、用而不深”的问题,核心芯片/软件/介质短板,以及存算运协同效率待提升等挑战。因此,她呼吁探索建设路径、共享最佳实践、强化技术攻关与生态协同。
从政策层面看,此前工信部等六部门印发的《算力基础设施高质量发展行动计划》,明确提出构建“算力、存力、运力”一体化发展体系,将存力纳入国家新型基础设施建设全局。
存力的重要性可见一斑。华为数据存储产品线战略与业务发展部总裁王旭东对记者表示,AI时代是数据的黄金时代。未来全球数据将以36%的速度持续增长,预计到2030年,全球数据将进入YB级。而目前,中国作为全球数据产量第二大国,数据保存率却不足5.1%。这意味着,大量潜在价值仍未被激活。
近年来,随着数据价值持续升温,政策和技术持续推进,催生了新型基础设施建设,存力中心就是代表之一。王旭东强调,存力中心通过“规模聚数、高效治数、安全供数、产业用数”四个维度,为数据的可信托管、治理、流通与开发提供能力闭环。
他还提到,广东韶关、重庆、贵州、廊坊等枢纽节点,也在同步建立存力中心,“存力中心未来可以成为省级备份灾备中心,或者行业、区域语料库,开发汇聚基地、产业聚集基地。”
存力中心迭代
AI与存力的结合,正在重塑数据存储的技术边界。
一方面,在存储介质上,过去存储依赖传统机械硬盘,而如今,AI场景对数据访问速度、可靠性、可扩展性的要求显著提升。
王旭东指出:“当前国内80%以上的数据仍保存在机械硬盘,相关产业被海外企业主导。近年来,面向全闪存这一新型的介质,华为等国内产业链发展较快。”他强调,面向先进数据存力底座构建,各行各业需要加速整个全闪存的应用,继续追赶。
另一方面,AI场景对“AI存储”的需求日益显著,AI训练依赖大规模数据的高频读写、边缘融合、长记忆存储等能力。因为当前国内产业链受限,短期内解决难度比较大,所以在王旭东看来,中国如何利用存算运协同的系统优势,来打破竞争的困境,需要持续思考。
“以存强算”是一个趋势,具体如何落实?华为数据存储产品线副总裁樊杰指出,在训练和推理阶段都可以以存强算,比如在训练阶段,包括数据归集、清洗和模型训练。关键在于如何高效汇聚和存储海量多模态数据,数据量越大、质量越高,训练效果越好。而目前很多算力集群利用率仅约30%,其余时间多被数据加载、归集和保存所占,优质的存力可以快速把数据存下来。
同时,在数据类型特别复杂的情况下,如何快速读取,低时延、大带宽,AI对存储提出新需求。通过存力技术提升,可以大规模提高训练的效率,“在实际的项目当中,可以把整个算力集群效率从30%提高到60%左右,几乎是翻倍。”樊杰说道。
AI时代,是算力为王的时代,但真正驱动大模型跃迁的背后,是海量、高质量、可信赖的数据支撑。要释放数据价值,不能缺位的,是一个基础坚实、架构先进、具备治理能力的存力中心。
如何把存力打造成“激活算力、推动产业、保障安全”的关键基础设施,仍需政策、技术与产业三端的深度协同。