首个AI计算开放架构问世 国内智算产业“安卓模式”加速到来
创始人
2025-09-11 19:05:26
0

来源:IT时报

我国算力总规模全球第二,规模和增速优势都较为显著。截至2024年底,我国算力总规模达280 EFLOPS(每秒百亿亿次浮点运算),其中智能算力占比32%。IDC预测,中国算力总规模将在2025年突破1000 EFLOPS。

但是,国产算力从“可用”到“好用”,还要翻越几座“高山”:高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等。

于是,发展更大更高效的智算集群,弥补单卡性能差距,成为重要创新方向。

在近日举行的2025世界智能产业博览会上,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布了国内首个AI计算开放架构,推出AI超集群系统,开放多项技术能力,并宣布依托国家先进计算产业创新中心启动“AI计算开放架构联合实验室”建设。

这一系列举措标志着中国智能计算产业的“安卓模式”加速到来,进入全面开放、紧密协作的新阶段。

“中国智算产业要苹果也要安卓”

2022年OpenAI横空出世时,模型的迭代时间大概为3~4个月。如今,全球每周都有一个新模型“打榜”。大模型几乎跑着从预训练时代奔向推理时代,将全球算力竞争推入深水区,行业的共识是算力的门槛越来越高。

但是,一款AI芯片从设计到量产,以两年为周期,而且单芯片性能提升的边际效应在递减。今年7月,几位国产芯片大佬坐下来对谈时,一直围绕着算力降本增效话题,大家给出的解决方案不约而同指向了软硬件协同与产业上下游合作。

破解“算力空转”的困局,从“能用算力”迈向“好用算力”,从“单点突破”走向“集群创新”,仅依靠少数巨头企业的封闭式优化已不够,需将产业链上下游的企业组织起来,实现开放式的跨层协作优化,打造开放式、标准化、高效率的集群算力。

中科曙光高级副总裁李斌表示:“中科曙光有30年高性能计算技术积累,在过去十年建设了20多个大规模算力集群,累计部署超50万张异构加速卡,同时又是国家先进计算产业创新中心牵头组建单位,我们应该来推动AI计算领域的开放协作与生态构建。”

业内普遍认为,国内的智算产业就像智能手机行业,不仅需要苹果这类大企业,还需要安卓式的生态创新模式。AI计算开放架构是面向大规模智能计算场景,以GPU为核心进行高效紧耦合系统设计的协同创新体系,从“算、存、网、电、冷、管、软”单点突破走向集群创新,联动AI产业链企业突破算力瓶颈,促进算力普惠。

中科曙光高级副总裁李斌

“我们现在做中国智算产业界的安卓生态,时机不晚。”李斌拿IT时代来对比,当时产业分工明确,技术架构演进慢,芯片、操作系统、中间件、软件等各环节在自有框架里各自优化,融合在一起就可以了,“但如今是智能计算时代,系统复杂了,产业链条长了,技术融合多了,安卓模式的出现,正是因为产业现在需要抱团取暖以应对国际形势,以开放换协作,以开放换共识。”

百万卡扩展 多品牌GPU适配

曙光AI超集群系统是AI计算开放架构的具象化。中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,曙光AI超集群系统可为万亿参数大模型训练推理、行业大模型微调、高通量推理、多模态大模型开发、AI4S等场景打造更大更高效算力底座,除了性能、效率、可靠等性能外,它与其他AI超节点的区别在于全面开放。

从技术层面来说,曙光AI超集群单机柜支持96加速卡、百P级AI算力,最大可实现百万卡大规模扩展。通过“超级隧道”AI存储优化、软硬协同设计、智能调度大模型等技术创新,实现千卡集群大模型训推性能达到业界主流水平2.3倍,模型开发效率提升高达4倍,GPU算效增加55%,平均无故障时间(MTBF)提高2.1倍,平均故障修复时间(MTTR)降低47%等。

与专有封闭系统相比,曙光AI超集群可适配支持多品牌GPU加速卡,兼容CUDA等主流软件生态,为用户提供更多选择,并大幅降低硬件成本和软件开发适配成本,保护前期投资。

“曙光AI超集群不仅是产品,更是面向产业界的开放创新平台。”杜夏威对《IT时报》记者表示。

打破“技术墙”和“生态墙”

为促进行业生态创新,中科曙光还联合芯片、整机等多家知名企业宣布开放一批关键技术能力,覆盖部件级、系统层、基础设施层、软件层和数据集等五个层面,以减少重复造轮子,降低中小企业研发门槛。

中科曙光首批宣布开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力,助力合作伙伴、重点用户在AI应用存储性能加速、液冷超节点系统设计、GPU统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。

曙光数创副总裁兼CTO张鹏表示,液冷技术对AI大集群是刚需,此次中科曙光实现了多层级液冷散热技术的产品化,可以有效保障整套系统交付的性价比。中科曙光在整个液冷散热技术中有着多年储备,经历了从冷板式液冷技术到浸没相变液冷技术,再到浸没液冷技术三个发展阶段,如今在浸没式液冷技术市场拥有过半的市场份额。

中科曙光将逐步开放相关技术,杜夏威提到,在存量数据消耗殆尽之际,如何依托科学研究产出更多新增的高价值数据,围绕着科研范式迭代,中科曙光也将为整个AI产业链条提供全方面支持。

相比封闭生态,开放的产业生态系统更加复杂。针对跨厂商技术对齐难等问题,中科曙光携手20多家智算上下游企业,依托国家先进计算产业创新中心共同建设“AI计算开放架构联合实验室”,以推进产业链开放与协作,共建开放、普惠的中国智能计算产业生态。

首个AI计算开放架构的诞生并非偶然。早在2018年,中科曙光就牵头成立了国家先进计算产业创新中心,当时希望以此拉通上下游资源,推动技术开放和高校合作,以破解生态壁垒。

“克服国内AI算力多维挑战,需汇聚芯片、计算系统、大模型等产业链多方力量。此次构建开放AI计算架构并拉通产业间跨层协作,是要打破‘技术墙’与‘生态墙’,协调好小我与大我,最终形成良性协作。”杜夏威向《IT时报》记者表示。

相关内容

热门资讯

高德这次,真的杀疯了! 就在9月10日,高德官宣上线了一个新功能——“高德扫街榜”,结果一天之内,直接炸场!你知道有多猛吗?...
可持续-网星LIMS系统:助力... 在当今时代,可持续发展已成为全球各行各业共同追求的目标,实验室领域也不例外。随着环保意识的增强和法规...
OpenAI与甲骨文“联姻”:... 全球科技领域迎来一则震撼消息:甲骨文(Oracle)联合创始人拉里·埃里森以3930亿美元身家登顶全...
联尚科技:以创新为核 激活发展... 近日,记者走进毕节市高新区贵州联尚科技有限公司生产车间内,机器运转声此起彼伏,工作人员穿梭于设备间,...
猿编程携星瀚智能套装亮相202... 本报讯 (记者袁传玺)9月10日,中国国际服务贸易交易会(以下简称“服贸会”)在北京开幕。其中,本届...
宇树科技官宣IPO后,王兴兴首... 在2025外滩大会开幕式圆桌论坛上,宇树科技创始人兼CEO王兴兴首次就大模型时代机器人产业发展发表深...
外滩大会观察:在Z世代涌入的科... 当 DeepSeek席卷全球AI战场,当宇树机器人在春晚舞台上演 “机械之舞”,这些在今年让世界侧目...
清理“赛博鬼秤”刻不容缓 来源:滚动播报 (来源:中工网) 显示广告时长119秒,实际播放123秒;倒计时80秒,实际广告播放...
东营首例!胜利油田中心医院成功... 大众网记者 李欣 东营报道 近日,胜利油田中心医院耳鼻喉科成功为一名复杂先天性中耳畸形患者实施功能性...
我市加快推动京津科技成果转移转... (来源:廊坊日报) 转自:廊坊日报 本报讯(记者 杨雅淇)9月9日,在京津冀国家技术创新中心燕郊中心...
北京互联网法院发布8起涉人工智... 为更好地服务保障人工智能产业健康有序发展,9月10日,北京互联网法院召开涉人工智能案件审理情况新闻发...
新石器无人车在重庆成立准时达科... 天眼查工商信息显示,近日,重庆准时达科技有限公司成立,法定代表人为李子夷,注册资本50万人民币,经营...
首个AI计算开放架构问世 国内... 来源:IT时报 我国算力总规模全球第二,规模和增速优势都较为显著。截至2024年底,我国算力总规模达...
限流式保护器怎么选?为直流充电... 01单相电气防火限流式保护器 型号:ASCP210-40D,ASCP210-63D 导轨式安装,具有...
2025年服贸会|激活数据新要... (记者 杜峰)数据智能中台里,数据像水流般被过滤、沉淀、再利用;“翼企问”像一座随叫随到的水闸为企业...
“超级电池”的“智”造工厂 特约记者 李婷婷 9月8日,走进咸安区凤凰科创园的柔电科技混合电池电容器生产基地项目,车间内一派忙碌...
宇树官宣IPO后王兴兴首发声:... 出品|搜狐科技 作者|常博硕 编辑|杨锦 在 2025 年的外滩大会上,一场名为“AI 原生时代,旧...
北京人工智能生态伙伴大会成功举... 9月10日,北京人工智能生态伙伴大会在北京首钢园成功举办。本次大会由全球数字经济大会组委会、全球数字...
OpenAI CFO警告:不拥... 来源:市场资讯 (来源:美股情报站) OpenAI的首席财务官萨拉·弗里尔最近在高盛的Communa...