原创 国产大模型DeepSeek R2参数飙升,全靠华为芯片,这次NVIDIA真慌了
创始人
2025-05-03 14:40:36
0

你可能没想到,一颗没用上NVIDIA芯片的中国AI模型,竟然又让美股科技板块吓出一身冷汗。

说的是DeepSeek R2。就在近期,关于它的最新爆料几乎炸穿了整个科技圈:总参数量飙到1.2万亿,整整比R1翻了一倍,而且训练全程完全没有用NVIDIA显卡,靠的全是华为的昇腾910B。

这事儿真的不只是模型换了芯片这么简单,它可能意味着,中国AI生态,真的要走出自己的那条“去N化”路线了。

先说参数,这次R2选择了混合专家模型(MoE)架构,加上更智能的门控机制,能在处理大负载任务时,实现更细粒度的专家调度——不是胡堆参数,而是让每一次推理都更“聪明地用力”。哪怕参数量翻倍,单位推理成本依然暴降,这背后,是算力调度的质变。

华为昇腾910B

具体降了多少?对标一下GPT-4你就知道了:据称,DeepSeek R2在推理环节的单位成本,相比GPT-4便宜了97.4%!这是什么概念?R2处理100万个字符输入只要0.07美元,输出也就0.27美元。直接把AI从“天价神器”打成“平价工具”。

更炸裂的是,整个训练过程压根没碰NVIDIA的GPU。所有的核心算力,全交给了华为昇腾910B。这枚国产AI芯片的计算能力在FP16精度下能跑到512 PetaFLOPS,芯片利用率高达82%,整体表现达到了A100集群的91%。这已经不是“能不能用”的问题了,而是国产芯片是否能真正“顶上去”的答案,已经初步揭晓。

要知道,这可不是小打小闹的实验室试验,而是实打实的工程级训练部署。如果后续R2真的上线,意味着中美在AI训练体系上,可能第一次形成了“硬件体系并行发展”的局面。

放在当下中美科技摩擦的大背景里,这个节点就更微妙了。NVIDIA的高端芯片出口已经受到新一轮限制,美国AI厂商依赖芯片的那种“护城河”正被削薄。DeepSeek R2这种“芯片自主+成本打折”的新路线,会不会成为中国AI真正意义上的“突围样本”?我觉得,有这个可能。

当然,现在的一切仍是爆料阶段,还需要看DeepSeek R2真正面世后的表现。但有一点可以肯定:它的技术选型和国产化程度,正在传递一种非常明确的信号——中国不打算在AI底层算力上再等美国开绿灯了。

说回最开始那个问题:为什么DeepSeek R2能让NVIDIA再次“颤一颤”?因为它不仅从成本上正面压制了OpenAI的产品,还在算力上提供了一个去N化的替代路径。而这,可能才是AI格局变动的真正开始。

你怎么看?你觉得华为的芯片,真的能撑得起中国AI的大模型吗?欢迎评论区聊聊,我们一起拆这场大模型风暴背后的国产力量。

相关内容

热门资讯

2025年DeepSeek快速... 《DeepSeek 快速入门指南(医生版)》为医生和医疗工作者全面介绍了人工智能大语言模型 Deep...
美国科学家:终于从中国借到了月... 4月24日,在第十个“中国航天日”启动仪式上,中国国家航天局对外发布嫦娥五号任务月球样品国际借用申请...
广州蓝虎新能源取得电池单体顶封... 金融界2025年5月3日消息,国家知识产权局信息显示,广州蓝虎新能源有限公司取得一项名为“电池单体的...
富士X-Half紧凑型相机镜头... 【太平洋科技快讯】近日,相关曝料透露了富士即将推出的紧凑型相机——X-Half的镜头参数。该相机将配...
户外热催生“加速度” 浙江三门... 台州5月4日电(胡丰盛 郦华琴 陈能)“五一”假期,“体育+”赛事在全国各地掀起热潮,带动户外消费持...
从科学家到企业家:一位“80后... “第一次出海是带着求知去,第二次是带着技术去,第三次则是带着产品出去……”不久前,在成都博恩思医学机...
他们毕业于985,却没把人生交... 文 | 高见科技论,作者 | 高恒 他们曾是标准答案的书写者。 年少时一路拼搏,被称为“别人家的孩...
索尼Xperia 1 VII手... 跑分库信息显示,新机型号为XQ-FS54,搭载高通骁龙 8 至尊版芯片,主频为 4.32GHz,配备...
视源股份获得发明专利授权:“万... 证券之星消息,根据天眼查APP数据显示视源股份(002841)新获得一项发明专利授权,专利名为“万向...
基于科学基础大模型的智能科研平... 4月29日, 中国科学院自动化研究所(以下简称“自动化所”)在第八届数字中国建设峰会上 发布基于科学...
青岛海信日立空调取得空调热泵系... 金融界2025年5月2日消息,国家知识产权局信息显示,青岛海信日立空调系统有限公司取得一项名为“空调...
东晟先创取得一种服务器机柜的布... 金融界2025年5月3日消息,国家知识产权局信息显示,北京东晟先创科技发展有限公司取得一项名为“一种...
南京中鲲仪器申请大浓度总烃监测... 金融界2025年5月3日消息,国家知识产权局信息显示,南京中鲲仪器科技有限公司申请一项名为“一种大浓...
圆周率科技申请图像降噪等相关专... 金融界2025年5月2日消息,国家知识产权局信息显示,圆周率科技(常州)有限公司申请一项名为“图像降...
用青春定义“智能+”:创新浪潮... 当青春遇上“智能+”,激情和创造力“双向奔赴”! 这个“五一”假期,身高1.2米的人形机器人“N2”...
个性化智能体?能为企业带来怎样... 在当今数字化快速发展的时代,业务流程的高效性已成为企业在激烈市场竞争中脱颖而出的关键因素。个性化的智...
千元级外骨骼机器人来了,你会买... 15秒卖光!几周前,一款2599元的外骨骼设备刚上架网店就抢购一空。这款来自程天科技的产品,就是两年...
中兴通讯获得发明专利授权:“用... 证券之星消息,根据天眼查APP数据显示中兴通讯(000063)新获得一项发明专利授权,专利名为“用于...
先导智能获得发明专利授权:“真... 证券之星消息,根据天眼查APP数据显示先导智能(300450)新获得一项发明专利授权,专利名为“真空...
荣耀申请地理围栏生成等专利,能... 金融界2025年5月3日消息,国家知识产权局信息显示,荣耀终端股份有限公司申请一项名为“地理围栏生成...