一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起
创始人
2025-02-01 00:04:54
0

「俗话」说得好:「打不过就加入」。

一开始便对DeepSeek赞赏有加的英伟达,刚刚宣布:「DeepSeek-R1正式登陆NVIDIA NIM」。据介绍,在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达3,872 Token/秒。

同在今天,亚马逊也在Amazon Bedrock和SageMaker AI中,上线了DeepSeek-R1模型。

曾经冲出来和OpenAI一起高调质疑DeepSeek「偷窃」数据的微软,甚至在前一天就把DeepSeek-R1抢先部署在了自家的云服务Azure上。

除了科技大厂,AI初创们也没有放过如此上好的机会。

Windsurf编辑器同时集成了DeepSeek-R1和V3模型,并且第一次在编程智能体中,实现了R1的工具调用。

Cerebras不仅实现了比GPU快57倍的推理速度,而且还报告称,自己部署的70B模型在准确率上要比GPT-4o和o1-mini更高。

中国AI正在崛起

在吴恩达看来,本周围绕DeepSeek的热议,让许多人清晰地看到了几个一直存在的重要趋势:

  1. 美国在GenAI领域的领先地位正在被中国迎头赶上,AI供应链格局将被重塑

  2. 开放权重模型正在推动基础模型层商品化,为应用开发者带来新机遇

  3. 扩大规模并非通往AI进步的唯一途径。尽管算力备受追捧,但算法创新正在快速降低训练成本

中国在GenAI领域正在赶上美国

当ChatGPT于2022年11月推出时,美国在GenAI领域明显领先于中国。

由于观念的转变十分缓慢,所以吴恩达直到最近,都还能听到不少关于中国仍然落后的论调。

但实际上,双方的差距已经在过去两年中迅速缩小。

随着Qwen(吴恩达团队已经用了几个月)、Kimi、InternVL和DeepSeek等模型的推出,中国在文本模型上的差距正在缩小,而在视频生成等领域,中国甚至已经展现出了一些领先优势。

如今,DeepSeek-R1不仅开源了模型权重,而且还分享了一份包含诸多细节的技术报告。

相比之下,一些美国公司却通过渲染人类灭绝等假想的AI危险,推动制定法规来阻止开源的发展。

不可否认的是,开源/开放权重模型都是AI供应链的关键部分——很多公司都在用。

对此,吴恩达表示:如果美国继续妨碍开源,AI供应链的这一环节就将由中国主导。

开放权重模型正在使基础模型层普及化

一直以来,LLM的Token价格都在迅速下降,开放权重模型不仅加速了这一趋势,并且还为开发者提供了更多选择。

OpenAI的输出价格为60美元/百万Token;而DeepSeek R1只要2.19美元。这种近30倍的差异让许多人注意到了价格下降的趋势。

训练基础模型并提供API服务充满困难,很多AI公司至今仍在寻找收回模型训练成本的途径。

相比之下,在基础模型之上进行应用开发,则有着绝佳的商机。

扩大规模并非AI进步的唯一途径

围绕通过扩大模型规模来推动进步的热议有很多,就连吴恩达也是早期的支持者之一。

许多公司为了数十亿美元的融资, 制造「噱头」:

只要有更多资金,他们就能(1)扩大规模并(2)可预测地推动改进。

因此,人们开始过分关注规模的scaling,而忽视了其他方式取得的进步。

受到美国AI芯片禁令的影响,DeepSeek团队不得不在性能相对较低的H800 GPU上跑模型,而这也推动了他们在优化方面的大量创新。最终,模型训练成本(不包括研究成本)不到600万美元。

这是否真能减少计算需求仍有待观察。有时,商品的单价变得更低,反而会导致该商品的总支出增加。

吴恩达认为:「从长远来看,对智能和算力的需求是几乎没有上限的,所以即使智能变得更便宜,人类依然会使用更多智能。」

在X上,我们可以看到很多对DeepSeek进展的不同解读。就像「罗夏墨迹测试」一样,可以让许多人将自己的理解投射其中。

虽然DeepSeek-R1的地缘政治影响仍有待明确,但它对AI应用的开发者来说确实是个好消息。

吴恩达的团队已经在头脑风暴一些新的想法,而这些想法之所以成为可能,仅仅是因为我们可以轻松访问一个开放的高级推理模型。

现在仍然是一个创造的好时机!

DeepSeek带来的三个启示

DeepSeek的成功,甚至「炸出」了芯片、计算行业的老兵——英特尔前CEO Pat Gelsinger。

作为业内非常资深的工程师,Gelsinger认为,现在这些针对DeepSeek的反应,忽视了我们在过去五十年计算机发展历程中学到的三个重要教训。

第一:计算遵循「气体定律」

计算会像气体一样, 填满由可用资源(资本、电力、散热限制等)定义的可用空间。

正如在CMOS、个人电脑、多核处理器、虚拟化、移动设备等众多领域看到的那样,以极低的价格广泛提供计算资源,将推动市场的爆炸性扩张,而不是收缩。

未来AI将无处不在,而今天,要实现这一潜力的成本仍然高得离谱。

第二:工程的本质就是应对约束

很明显,DeepSeek团队面临诸多约束,但他们找到了极具创造性的方法,并以低10-50倍的成本,交付了世界一流的解决方案。

美国的禁令限制了可用资源,因此中国的工程师不得不发挥创造力,而他们也确实做到了——价值数百亿美元的硬件、最新的芯片和数十亿美元的训练预算,都不再是必需品。

多年前,Gelsinger曾采访过最为著名的计算机科学家之一Donald Knuth。他详细描述了当资源极度受限、进度要求最紧迫时,该如何做出最好的工作。

Gelsinger表示,这个见解是他工程管理生涯中最重要的启示之一。

第三:开放终将胜利

过去几年,看到正变得越来越封闭的基础模型研究,实在令人失望。

在这一点上,Gelsinger更认同马斯克而不是奥特曼的观点——我们真的希望,不,是需要AI研究的开放性得到提升。

我们需要知道训练数据集是什么,研究算法并对其正确性、伦理和影响进行深入思考。Linux、GCC、USB、WiFi等众多例子,已经让这一点无比清晰。

在法律、频谱、工程和采用方面的战斗中,开放并不容易,并且始终在受到市场力量的挑战。但只要给一个适当的机会,「开放」每次都会胜出。

AI对人类未来的重要性不言而喻,因此,绝对不能让一个封闭的生态系统在这个领域成为唯一的主宰。

DeepSeek是一个令人难以置信的工程壮举——它将推动AI实现更广泛发采用,并将帮助重塑行业对开放创新的看法。

正是这样一个来自中国的高度受限的团队,让我们所有人重新想起了这些计算机历史的基本教训。

参考资料:

相关内容

热门资讯

美媒:大脑芯片技术日渐成熟 参考消息网7月9日报道据美国石英财经网站7月7日报道,经过逾50年的研究,脑部植入技术已从实验室里的...
【特稿】美国教师要学AI 三大... 美国教师要学AI 三大美企联手培训 李贝阳 美国教师联合会8日在纽约市宣布,将与美国人工智能技术巨头...
黑林铺街道多社区联合开展红色阅... “没有共产党就没有新中国……”在黑林铺街道沙沟社区综合文化服务中心内,激昂嘹亮的歌声回荡,沙沟社区联...
山东恒亚申请车磨铣复合机床专利... 金融界2025年7月9日消息,国家知识产权局信息显示,山东恒亚机床制造有限公司申请一项名为“一种车磨...
原创 7... 月9日将成有史以来最短一天,科学奇观引发热议 在浩瀚的宇宙时间轴上,每一个瞬间都承载着独特的意义。而...
故宫博物院青少网站英文版、繁体... 故宫博物院青少网站英文版、繁体版上线暨2025年故宫-香港青年文化从业者“文化+科技训练营”开营仪式...
追火箭看排球听摇滚 文昌邀请各... 人民网海口7月9日电 (记者李学山)7月9日,由文昌市政府主办的“文昌是个好地方,邀您留一夏”202...
强化海洋战略科技力量 近日召开的中央财经委员会第六次会议提出,提高海洋科技自主创新能力,强化海洋战略科技力量。这有助于筑牢...
13.17秒跑完100米!全球... 7月7日消息,在浙江大学杭州国际科创中心(简称科创中心)首期开园五周年之际,科创中心人形机器人创新研...
飞书:发布多款AI产品,多行业... 【飞书召开AI产品发布会,发布升级多款产品助力企业AI落地】如今,AI大模型成不少人提效“神器”,但...
小红书不想只做一个「有用」的社... 文 | 阑夕 小红书的Slogan,变了。 从「你的生活指南」,改成了「你的生活兴趣社区」,虽然只是...
艾宝特智能取得电动直压开合模装... 金融界2025年7月8日消息,国家知识产权局信息显示,惠州市艾宝特智能科技股份有限公司取得一项名为“...
无人机“飞”进社区课堂 青少年... “机翼有正反,装反了小飞机可飞不起来哦!”在长安区太乙宫街道正街社区的活动室里,大学生志愿者正手把手...
贵阳这支算法团队,一年跻身西南... 日前,国际数据公司(IDC)最新报告显示,字节跳动旗下的豆包大模型在中国公有云大模型市场份额排名第一...
聚焦“天地一体”,中科曙光、中... 文 观察者网 武守哲 在全球空天竞争日趋激烈的背景下,7月8日,中科曙光与中科星图在合肥“2025空...
广州中慧上启科技靠谱吗? 在深化产教融合的国家战略推进中,广州中慧上启科技有限公司作为教育部备案的职业教育培训评价组织其教育软...
义乌太阳能风扇帽风靡海外市场 ... 央视网消息:随着全球多地气温持续走高,各类清凉小商品成为出口市场的爆款单品。截至7月初,这款走红海外...
济南园林集团与山东省互联网传媒... 记者 李萍 济南报道 7月9日,济南园林开发建设集团有限公司与山东省互联网传媒集团举行交流座谈会。济...
“本源悟空”引领:中国自主超导... 在科技领域,一场关于计算革命的新浪潮正在悄然兴起,其核心在于量子计算与人工智能的深度融合。这一趋势被...
漳州科华电气申请三电平变换器控... 金融界2025年7月9日消息,国家知识产权局信息显示,漳州科华电气技术有限公司申请一项名为“三电平变...