原创 不缺卡的阿里系,选择了讯飞星火的国产算力路线
创始人
2025-03-26 04:01:18
0

在全球AI算力竞赛的焦灼时刻,在阿里系保有充足英伟达GPU库存的条件下,蚂蚁集团于2025年3月24日发布基于国产算力训练的百灵-Ling系列MoE架构大模型,这一动作距离科大讯飞成功在昇腾国产算力集群上实现MoE模型推理方案仅过去13天。

这场战略转向,无疑为国产算力和国产大模型的全国产化带来一剂强心针。

据报道,3月18日阿里巴巴CEO吴泳铭主张在阿里现有业务中全面实现“AI化”。阿里所有部门已被告知,他们2025年的绩效将通过如何利用AI促进增长来评估。时隔一周,阿里系企业蚂蚁集团便发表了AI方面最新进展的论文。

蚂蚁集团Ling团队推出的百灵轻量版参数规模为 168 亿(激活参数 27.5 亿),增强版基座模型参数规模高达 2900 亿(激活参数 288 亿),性能均达行业领先水平。

实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE 模型相当。

MoE模型训练通常依赖英伟达H100 / H800等高性能GPU,成本高昂且芯片短缺,限制了其在资源受限环境中的应用。直到今年3月,科大讯飞与华为联合团队宣布,成功在昇腾国产算力集群上实现MoE模型的大规模跨节点专家并行推理。

这是继深度求索(DeepSeek)公开MoE训练方案后,业界首个完全基于国产算力的解决方案。

星火大模型自2024年1月发布V3.5版本以来,一直是基于国产算力训练的代表,至今仍是唯一的全栈国产化全民开放大模型。

本次科大讯飞与华为合作,通过算子融合、混合并行策略和通信计算并行优化等一系列创新,使得讯飞星火在国产算力上实现了显著性能提升:单卡静态内存占用缩减至双机部署的1/4,效率提升75%,专家计算密度增加4倍,推理吞吐提升3.2倍,端到端时延降低50%。

科大讯飞称,这一突破性的解决方案也将应用于讯飞星火深度推理模型X1的训练加速,预期训练时推理效率将提升200%。星火X1模型基于华为昇腾910B芯片,以70B参数量,实现了在数学能力上全面对标DeepSeek R1(参数量671B)和OpenAI o1,中文数学任务全面领先的效果。这种"小参数强算法"与"大模型低成本"的互补创新,形成对传统算力范式的降维打击。

美国对华AI芯片出口限制的持续加码,加速了技术迁徙进程,而讯飞与蚂蚁的实践超越了硬件替代逻辑。

讯飞星火验证了国产算力训练MoE架构大模型的可行性,蚂蚁百灵快速跟进取得突破,不仅验证了算力自主的可能性,更揭示了全球AI竞赛规则的深层变革——从硬件性能追逐转向架构创新与场景适配的深度融合,从技术替代逻辑演变为创新范式的定义权之争。

相关内容

热门资讯

AIGC专题:AIGC赋能城市... 今天分享的是:AIGC专题:AIGC赋能城市治理应用白皮书 报告共计:39页 《AIGC赋能城市治理...
卢伟冰开直播:小米15周年战略... 快科技5月16日消息,小米集团总裁卢伟冰预告,今年是小米15周年,我们准备了很多“献礼”新品,上午介...
AI专题:AI搜索发展洞察报告... 今天分享的是:AI专题:AI搜索发展洞察报告2025 报告共计:26页 《AI专题:AI搜索发展洞察...
10款短剧应用入围出海应用收入... 北京商报讯(记者 卢扬 实习生 史子潇)5月16日,Sensor Tower发布《2025年4月移动...
国网天津电力:“四快套餐”助力... “自从完成增容后,我们的新生产线运行非常稳定,实现了产能翻倍,供电公司的快速响应真是为我们争取了宝贵...
中国电信为千行百业构筑起新质生... 在新一代人工智能浪潮之下,作为科技创新国家队和发展新质生产力排头兵的央企责无旁贷。中国电信湖北公司锚...
M&S 数据泄露后强制... Marks and Spencer ( M&S ) 已确认在 Easter DragonForce ...
iOS 18.4发布!苹果智能... 4月1日消息,苹果向iPhone用户推送了iOS 18.4正式版更新(内部版本号:22E240),带...
中国科学院上海微系统所开发出高... 5 月 16 日消息,中国科学院宣布,上海微系统与信息技术研究所研究员武震宇、助理研究员王栎皓团队,...
2024年苹果智能手表出货量同... 据Counterpoint Research最新数据,苹果2024年全球智能手表出货量同比下降19%...
意法半导体取得控制电路和集成电... 金融界2025年5月16日消息,国家知识产权局信息显示,意法半导体国际公司取得一项名为“控制电路和集...
最潮的Live图神机来了!OP... 一、前言:OPPO Reno 永远最懂年轻人的时尚旗舰 OPPO Reno向来就是最会满足年轻人的产...
中国移动“三大回馈计划”暨51... 央广网北京5月16日消息 5月15日国际家庭日,中国移动以“移动爱家 移起AI”为主题,举办“三大回...
华为四款新品在柏林发布 首发多... 【CNMO科技消息】近日,CNMO注意到,华为终端在德国首都柏林成功举办华为2025创新产品发布会,...
阿里吴泳铭:AI是历史性机遇,... 封面新闻记者 孟梅 雷强 5月15日晚,在2025财年Q4及全年财报分析师电话会上,阿里巴巴集团CE...
网站进行IPv6改造的步骤有哪... 在互联网技术不断革新的当下,IPv6的全面普及已成为行业发展的必然趋势。相较于IPv4,IPv6拥有...
原创 国... 一块指甲盖大小的晶体,竟让全球半导体巨头集体侧目。 北京大学实验室里,科学家用比纸薄十万倍的材料,造...
Qwen这一步,比发大模型更有... 文:王智远 | ID:Z201440 前几天,阿里Qwen chat上线了Deep Research...
潮汐引擎加持 OPPO Ren... 全新OPPO Reno14系列正式发布,新机不光拥有出众的颜值和出色的拍照体验,同时还预装了Colo...
贝特瑞发布“全链新生”正负极材... 中证报中证网讯(王珞)5月15日,在CIBF2025展会上,贝特瑞发布“全链新生”正负极材料闭环回收...