原创 国产大模型DeepSeek R2参数飙升,全靠华为芯片,这次NVIDIA真慌了
创始人
2025-05-03 14:40:36
0

你可能没想到,一颗没用上NVIDIA芯片的中国AI模型,竟然又让美股科技板块吓出一身冷汗。

说的是DeepSeek R2。就在近期,关于它的最新爆料几乎炸穿了整个科技圈:总参数量飙到1.2万亿,整整比R1翻了一倍,而且训练全程完全没有用NVIDIA显卡,靠的全是华为的昇腾910B。

这事儿真的不只是模型换了芯片这么简单,它可能意味着,中国AI生态,真的要走出自己的那条“去N化”路线了。

先说参数,这次R2选择了混合专家模型(MoE)架构,加上更智能的门控机制,能在处理大负载任务时,实现更细粒度的专家调度——不是胡堆参数,而是让每一次推理都更“聪明地用力”。哪怕参数量翻倍,单位推理成本依然暴降,这背后,是算力调度的质变。

华为昇腾910B

具体降了多少?对标一下GPT-4你就知道了:据称,DeepSeek R2在推理环节的单位成本,相比GPT-4便宜了97.4%!这是什么概念?R2处理100万个字符输入只要0.07美元,输出也就0.27美元。直接把AI从“天价神器”打成“平价工具”。

更炸裂的是,整个训练过程压根没碰NVIDIA的GPU。所有的核心算力,全交给了华为昇腾910B。这枚国产AI芯片的计算能力在FP16精度下能跑到512 PetaFLOPS,芯片利用率高达82%,整体表现达到了A100集群的91%。这已经不是“能不能用”的问题了,而是国产芯片是否能真正“顶上去”的答案,已经初步揭晓。

要知道,这可不是小打小闹的实验室试验,而是实打实的工程级训练部署。如果后续R2真的上线,意味着中美在AI训练体系上,可能第一次形成了“硬件体系并行发展”的局面。

放在当下中美科技摩擦的大背景里,这个节点就更微妙了。NVIDIA的高端芯片出口已经受到新一轮限制,美国AI厂商依赖芯片的那种“护城河”正被削薄。DeepSeek R2这种“芯片自主+成本打折”的新路线,会不会成为中国AI真正意义上的“突围样本”?我觉得,有这个可能。

当然,现在的一切仍是爆料阶段,还需要看DeepSeek R2真正面世后的表现。但有一点可以肯定:它的技术选型和国产化程度,正在传递一种非常明确的信号——中国不打算在AI底层算力上再等美国开绿灯了。

说回最开始那个问题:为什么DeepSeek R2能让NVIDIA再次“颤一颤”?因为它不仅从成本上正面压制了OpenAI的产品,还在算力上提供了一个去N化的替代路径。而这,可能才是AI格局变动的真正开始。

你怎么看?你觉得华为的芯片,真的能撑得起中国AI的大模型吗?欢迎评论区聊聊,我们一起拆这场大模型风暴背后的国产力量。

相关内容

热门资讯

中科三环:探讨出口许可与产能扩... 中科三环(000970)发布公告,2025年6月19日,公司举行了特定对象调研活动,参与单位包括华泰...
荣耀X70i千元机携手中国移动... 荣耀与中国移动在最近的荣耀AI技术沟通大会上携手宣布了一项重大合作,而合作的先行者——荣耀X70i智...
Switch 2系统更新20.... Switch 2系统更新20.1.5现已上线,其中包含整体稳定性改进以及一些未公开的改进。 从官方...
Asana前沿AI功能出现数据... Asana已修复其模型上下文协议(MCP)服务器中的一个漏洞,该漏洞可能允许用户查看其他组织的数据。...
金融AI应用机遇挑战并存,陆家... 共议共建、共筑、共创之路。 人工智能(AI)快速发展,正在重塑金融行业的工作范式。在这过程中,AI给...
可奥熙光学取得复合式反应釜结构... 金融界2025年6月19日消息,国家知识产权局信息显示,江苏可奥熙光学材料科技有限公司取得一项名为“...
旭辉恒远取得散装大袋生产用裁剪... 金融界2025年6月19日消息,国家知识产权局信息显示,天津市旭辉恒远塑料包装股份有限公司取得一项名...
Labubu 3.0首次开启线... 2025年6月18日晚,泡泡玛特旗下顶流IP Labubu第三代产品“前方高能”系列首次开启全球线上...
拍摄档期排到年底,影视剧组缘何... 从阳光明媚、微风习习的白天,到月光皎洁、烟花绽放的夜晚,需要多长时间?在重庆永川科技片场,答案是1秒...
中国电信联合华为发布“智聚大上... 近日,在2025 MWC 上海期间,中国电信联合华为举办5G-A“智聚大上行”创新发布会。会上,中国...
特斯拉下一代FSD芯片量产,算... 2025-06-19 07:41:02 作者:狼叫兽 特斯拉下一代FSD(完全自动驾驶)芯片现已...
飞利浦、未野、小米迷你mini... 迷你剃须刀占尽了小机身的市场红利,如今已发展为剃须界的巨头。可是小机身也蕴藏大烦恼,迷你剃须刀结构限...
微软宣布进入逻辑量子比特时代 微软宣布结束噪声易错量子机器时代,将其庞大资源投入构建容错 量子计算机,旨在与 人工智能和经典高性能...
64款违规收集个人信息APP被... 6月18日,国家网络安全通报中心发布消息称,经国家计算机病毒应急处理中心检测,发现64款移动应用存在...
美国大企业又掀裁员潮!这次与人... 受特朗普政府贸易政策引发的全球经济不确定性影响,企业成本削减压力持续加剧。微软、宝洁、沃尔玛、亚马逊...
新民侨梁 | 英国将斥资1.8... 英国政府近日表示,作为政府1.87亿英镑“TechFirst”(科技优先)计划的一部分,100万名学...
可视化模型为地震预警开辟新路径 新华社北京6月18日电 美国研究人员近日在美国《国家科学院学报》上发表论文称,通过构建可视化的地震模...
我国宽温域锂离子电池研究获新突... 中国科学院青海盐湖研究所溶液化学课题组在宽温域镁基锂离子电池研究领域近日取得新进展。该科研成果近日发...
荣耀与中国移动宣布AI终端战略... 【2025年6月19日】荣耀与中国移动在上海联合举办“中国移动&荣耀AI终端战略合作发布会”。此次合...
WEKA推出NeuralMes... WEKA宣布推出NeuralMesh并行文件系统软件转型方案,用于加速大规模 AI应用。 该方案基...