DeepSeek搅局,算力需求真的要崩塌了吗?
创始人
2025-02-06 23:01:29
0

DeepSeek,这家中国的初创AI公司,正以惊人的效率革命颠覆着人工智能行业的成本结构,引发了全球范围内的广泛关注与讨论。

DeepSeek的开发成本极低,不仅开源而且服务完全免费,这一模式让众多AI从业者眼前一亮,甚至让世界首富马斯克都感到震惊。知名投资人“木头姐”凯茜·伍德更是直言不讳,称DeepSeek加剧了人工智能的成本崩溃。这股来自东方的神秘力量,不仅让世界为之侧目,更引发了中美AI领导地位更替的深思。

DeepSeek的颠覆性创新在于其极致的效率。据悉,DeepSeek仅用不到OpenAI十分之一的成本,就达到了后者最新大模型的性能。1月20日,DeepSeek正式发布了DeepSeek-R1模型系列,在Chatbot Arena大模型排行榜上,DeepSeek-R1的基准测试排名迅速攀升至全类别第三,与ChatGPT-4o最新版并驾齐驱,并在风格控制类模型分类中与OpenAI-o1并列榜首。这一成绩无疑是对DeepSeek效率的最佳证明。

据DeepSeekV3技术报告显示,V3模型的训练总计仅需要278.8万GPU小时,相当于在2048块H800(英伟达特供中国市场的低配版GPU)集群上训练约2个月,合计成本仅557.6万美金。而相比之下,GPT-4o模型的训练成本高达1亿美元,需要万块以上的H100 GPU。DeepSeek以不到十分之一的成本,达到了世界一流水平,这无疑是对传统“高投入、高算力”研发路径的一次重大挑战。

DeepSeek的成功,源于其自研的MLA和MOE架构,以及数据蒸馏技术的运用。通过一系列算法和策略,DeepSeek将原始复杂的数据进行去噪、降维、提炼,从而得到更为精炼、更有用的数据,极大提升了训练效率。这种“四两拨千斤”的能力,让DeepSeek在AI领域脱颖而出。

然而,DeepSeek的出现也引发了一些争议。OpenAI等科技大厂指责DeepSeek通过“模型蒸馏”技术“违规复制”其产品功能,但始终未提供具体证据。关于数据蒸馏技术的争议也在网络上持续发酵。但无论如何,DeepSeek已经以其颠覆性的成本优势,改变了人工智能产业的发展轨迹。

DeepSeek的颠覆性创新,不仅打破了摩尔定律和Scaling Law在AI行业的传统认知,更引领了AI创新进入追求效率、追求模型架构设计、工程优化的全新阶段。这一“范式转移”不仅破除了科技大厂建立的技术领先壁垒,还打破了重资本比拼的游戏惯例。DeepSeek的开源和免费模式,更是让全球AI行业为之震动。

面对DeepSeek的挑战,科技大厂们纷纷作出回应。OpenAI紧急上线新一代推理模型o3系列的mini版本,并首次免费向用户开放其基础功能。微软、谷歌、亚马逊、meta、苹果等巨头也加大了在AI领域的投入,期望通过“军备竞赛”维持自身在AI领域的全球领导地位。然而,DeepSeek的出现已经改变了超大规模扩张算力的行业发展“固定路径”,让科技大厂们的超级愿景面临挑战。

尽管如此,对于算力进行重新判断仍为时尚早。当前,我国算力部署占全球算力基础设施的26%,名列世界第二。在“算力即国力”的思潮下,东数西算等数字基础设施工程正积极进行。这些大规模部署和研发投入,都具有历史性的战略意义,是人工智能时代的重要社会财富。

DeepSeek的成功,不仅是中国AI行业的骄傲,更是中国智慧的体现。在资源匮乏的历史条件下,中国实现了工业现代化,而DeepSeek则以低成本开发出优质产品,再次展现了中国在创新领域的独特文化和韧性。中美AI的拉锯战中,DeepSeek的崛起无疑为中国企业赢得了一席之地,也让全球科技界重新审视中国AI的实力和潜力。

来源:http://www.cnu.com.cn/industry/202502/49798.html

相关内容

热门资讯

新能源装配新利器:高精度机器人... 随着新能源产业的快速发展,对电池与电机的装配精度提出了前所未有的挑战,这一需求正引领着机器人夹爪技术...
218个项目!全国智能机器人锦... 深圳新闻网2025年7月8日讯(深圳商报记者 陈发清)近日,2025全国颠覆性技术创新大赛智能机器人...
阿里云智能副总裁安筱鹏 | 工... AI大模型的融入能显著提升制造业的竞争力,其中包含两个风向标:第一个风向标是今年1月美国拉斯维加斯的...
南科大“空海潜”无人集群挺进深... 深圳商报·读创客户端首席记者 吴吉 通讯员 洪妍 7月7日,南方科技大学海洋高等研究院牵头,联合科研...
开闭所、配电房智慧化改造:配网... 1、配网站房存在的问题 配网站房存在总数多、遍布范围广等情况,站点巡视耗人耗力,缺少提高效率的信息...
突破技术瓶颈!我国团队首次实现... ◎ 科技日报记者 陈曦 通讯员 赵晖 记者7日从天津大学获悉,该校精密仪器与光电子工程学院光电子科学...
原创 6... 下半年会有一大波小屏旗舰手机上市,而且骁龙8 Elite 2处理器也会提前到9月份发布,到时候小米1...
超聚变申请虚拟机迁移方法等相关... 金融界2025年7月7日消息,国家知识产权局信息显示,超聚变数字技术有限公司申请一项名为“虚拟机迁移...
外卖大战喂饱了谁? “瑞幸越来越像霸王茶姬,它倾向于植物奶基底兑咖啡,更偏向于95、90后。库迪越来越像蜜雪冰城,它倾向...
智汇金城,数智未来!2025年... 7月7日,由兰州市政府主办,市工信局、市数据局、市投促局承办的2025年兰州市数字经济高质量发展大会...
任天堂财报确认持续研发XR技术... (映维网Nweon 2025年07月08日)根据新发布的财报文件,任天堂证实团队依然有在研究虚拟现实...
合肥盛宝电气取得一种干式变压器... 金融界2025年7月8日消息,国家知识产权局信息显示,合肥盛宝电气有限公司取得一项名为“一种干式变压...
DeepSeek罕见领英扩招A... DoNews7月8日消息,据报道,DeepSeek近日在LinkedIn上大幅加码招聘,释放出可能正...
赛杰爱迪取得三支撑绝缘子固定结... 金融界2025年7月8日消息,国家知识产权局信息显示,赛杰爱迪(江苏)高压电气有限公司取得一项名为“...
广州凯康科技太赫兹掌中宝THz... 广州凯康科技THzMini迷你太赫兹水仪 太赫兹掌中宝迷你共振水仪-太赫兹健康水仪 (0.96) 健...
5G LAN再突破:广域互联开... 面对航空航天、金融保险等行业对数据传输安全,仓储物流等行业对灵活网络部署,政务、交通等行业对网络容灾...
青岛故事|专注造“心”出口30... 为发动机制作高端“心脏”,产品出口到30多个国家和地区;与80余家国内外著名企业建立全面战略合作关系...
2025人形机器人元年:“狂欢... 文 | 智能相对论,作者 | 陈泊丞 过去的半年,资本、工厂、媒体以及大众都盯上了人形机器人。 在...
再玩科技取得手持风扇专利 有效... 金融界2025年7月8日消息,国家知识产权局信息显示,深圳市再玩科技有限公司取得一项名为“一种手持风...
“AI医生”加速进化!两天完成... 转自:上观新闻 清华大学智能产业研究院院长张亚勤近日在接受第一财经的电视节目采访时表示,AI医院用...