原创 国产大模型DeepSeek R2参数飙升,全靠华为芯片,这次NVIDIA真慌了
创始人
2025-05-03 14:40:36
0

你可能没想到,一颗没用上NVIDIA芯片的中国AI模型,竟然又让美股科技板块吓出一身冷汗。

说的是DeepSeek R2。就在近期,关于它的最新爆料几乎炸穿了整个科技圈:总参数量飙到1.2万亿,整整比R1翻了一倍,而且训练全程完全没有用NVIDIA显卡,靠的全是华为的昇腾910B。

这事儿真的不只是模型换了芯片这么简单,它可能意味着,中国AI生态,真的要走出自己的那条“去N化”路线了。

先说参数,这次R2选择了混合专家模型(MoE)架构,加上更智能的门控机制,能在处理大负载任务时,实现更细粒度的专家调度——不是胡堆参数,而是让每一次推理都更“聪明地用力”。哪怕参数量翻倍,单位推理成本依然暴降,这背后,是算力调度的质变。

华为昇腾910B

具体降了多少?对标一下GPT-4你就知道了:据称,DeepSeek R2在推理环节的单位成本,相比GPT-4便宜了97.4%!这是什么概念?R2处理100万个字符输入只要0.07美元,输出也就0.27美元。直接把AI从“天价神器”打成“平价工具”。

更炸裂的是,整个训练过程压根没碰NVIDIA的GPU。所有的核心算力,全交给了华为昇腾910B。这枚国产AI芯片的计算能力在FP16精度下能跑到512 PetaFLOPS,芯片利用率高达82%,整体表现达到了A100集群的91%。这已经不是“能不能用”的问题了,而是国产芯片是否能真正“顶上去”的答案,已经初步揭晓。

要知道,这可不是小打小闹的实验室试验,而是实打实的工程级训练部署。如果后续R2真的上线,意味着中美在AI训练体系上,可能第一次形成了“硬件体系并行发展”的局面。

放在当下中美科技摩擦的大背景里,这个节点就更微妙了。NVIDIA的高端芯片出口已经受到新一轮限制,美国AI厂商依赖芯片的那种“护城河”正被削薄。DeepSeek R2这种“芯片自主+成本打折”的新路线,会不会成为中国AI真正意义上的“突围样本”?我觉得,有这个可能。

当然,现在的一切仍是爆料阶段,还需要看DeepSeek R2真正面世后的表现。但有一点可以肯定:它的技术选型和国产化程度,正在传递一种非常明确的信号——中国不打算在AI底层算力上再等美国开绿灯了。

说回最开始那个问题:为什么DeepSeek R2能让NVIDIA再次“颤一颤”?因为它不仅从成本上正面压制了OpenAI的产品,还在算力上提供了一个去N化的替代路径。而这,可能才是AI格局变动的真正开始。

你怎么看?你觉得华为的芯片,真的能撑得起中国AI的大模型吗?欢迎评论区聊聊,我们一起拆这场大模型风暴背后的国产力量。

相关内容

热门资讯

基因编辑技术为唐氏综合征治疗提... 据新华社东京电(记者钱铮)日本三重大学等机构研究人员组成的团队日前在美国《国家科学院学报·交叉学科》...
锐评|你还记得自己第一次上网吗... “越过长城,走向世界。” 1987年9月14日,中国发出第一封电子邮件,标志着中国计算机首次成功连入...
原创 月... 家人们,今天咱唠唠月球背面那档子事儿啊!最近,科学家们发现月球背面惊现 2180 万亿吨的神秘异物,...
机器人跨越“三重门” 【本期嘉宾】 王 鹤 北京银河通用机器人有限公司创始人兼首席技术官 王 潜 自变量机器人公司创始人...
乘客机场下跪求助工作人员 海航... 9月9日晚,海南航空HU7712航班从深圳飞往北京途中,因北京暴雨天气被迫备降太原武宿国际机场。这一...
乐享新科技!光明区老年协会组织... 深圳商报·读创客户端记者 刘芳 通讯员 曾倩苏 日前,在光明区民政局的统筹安排下,光明区老年协会组织...
这家山东公司,自主研发了机器人... ■ 编者按大众日报·大众新闻推出“走在前、挑大梁·产业链上的山东好品牌”专栏,派出记者深入各产业链上...
重磅发布 | 北京数基建发布“... 9月12日,2025年中国国际服务贸易交易会期间,北京数基建正式发布“知行IntAct”(Intel...
“智”动服贸会 人形机器人不止... 新华社北京9月13日电 题:“智”动服贸会 人形机器人不止“炫技” 新华社记者王悦阳 在2025年中...
华为穿戴音频新品发布会,新品浮... 9月24日14:30华为穿戴音频新品发布会,新品浮出水面。 华为WATCH GT6系列 华为WA...
原创 三... 9月15日消息,据Fnnews报道,三星的 2nm GAA 技术可能取得了非凡的成果,这也使得其Ex...
小米跳过数字16直接发布“小米... 9月15日,小米集团合伙人、总裁卢伟冰在社媒上发文,官宣全新小米17系列将于本月与公众见面。 卢伟...
无化学品循环水处理系统 ---... 梅鲁斯物理除垢设备不用添加药剂的优势性分析 随着工业生产和生活用水设备的广泛应用,水垢问题日益突出,...
浙江钙科公布“一种生物质混合均... 天眼查APP显示,近日,浙江钙科科技股份有限公司申请的“一种生物质混合均匀的节能燃烧阶梯炉”专利公布...
原创 西... 既然公众普遍不相信“预制菜”,各方定义也不相同,也就说明,大家说的不是“预制菜”,而是别的什么东西,...
太空菜园丰收、开展应急演练……... 央视网消息:上周,神二十乘组按计划开展了各项空间科学实(试)验,那么他们又解锁了什么新体验?一起来看...
头部险企承保15万架无人机,“... 面对国内过万亿规模的低空经济市场,谁应为风险买单?9月11日,在2025年中国国际服务贸易交易会上,...
vivo X300 Pro正面... 去年10月,vivo X200系列正式发布,不仅在性能、影像、续航、通信、屏幕等多方面带来重大升级,...
中国电信江苏公司织牢AI时代数... 中国电信南通分公司反诈宣传走进“苏超”火热赛场 网络安全创新工作室联盟 中国电信灌云分公司科技护...
圣湘生物发布多款呼吸道新品 以... 9月12日,2025圣湘生物(688289.SH)呼吸道生态技术与产品发布会在长沙举办。围绕不同医疗...