吴恩达点评DeepSeek:非常出色,中国AI正在赶超美国
创始人
2025-02-01 00:06:01
0

鞭牛士报道,1月31日消息,美国计算机科学家,DeepLearning.AI创始人吴恩达在X上撰文点评了DeepSeek,他认为国在生成 AI 领域正在赶超美国,这对 AI 供应链产生了影响。以下为全文:

本周 DeepSeek 的讨论让许多人认识到一些显而易见的重要趋势:

(i) 中国在生成 AI 领域正在赶超美国,这对 AI 供应链产生了影响。

(ii) 开放权重模型正在将基础模型层商品化,这为应用程序构建者创造了机会。

(iii) 扩大规模并不是 AI 进步的唯一途径。尽管人们对处理能力的关注和炒作如火如荼,但算法创新正在迅速降低培训成本。

大约一周前,中国公司 DeepSeek 发布了 DeepSeek-R1,这是一个非常出色的模型,其基准测试性能可与 OpenAI 的 o1 相媲美。此外,它是以开放权重模型的形式发布的,具有宽松的 MIT 许可证。上周在达沃斯,我收到了许多非技术商业领袖关于它的问题。周一,股市出现了“DeepSeek 抛售”:Nvidia 和其他一些美国科技公司的股价暴跌。(截至撰写本文时,一些公司股价有所回升。)

我认为 DeepSeek 让很多人意识到了以下几点:

中国在生成式人工智能方面正在赶超美国。2022 年 11 月推出 ChatGPT 时,美国在生成式人工智能方面远远领先于中国。印象变化很慢,所以最近我听到美国和中国的朋友都说他们认为中国落后了。但实际上,这种差距在过去两年里迅速缩小了。借助 Qwen(我的团队已经使用了几个月)、Kimi、InternVL 和 DeepSeek 等来自中国的模型,中国显然正在缩小差距,而在视频生成等领域,中国似乎已经处于领先地位。

我很高兴 DeepSeek-R1 以开放权重模型的形式发布,其技术报告分享了许多细节。相比之下,许多美国公司通过大肆宣传人类灭绝等假设的人工智能危险来推动监管以扼杀开源。现在很明显,开源/开放权重模型是人工智能供应链的关键部分:许多公司都会使用它们。如果美国继续阻碍开源,中国将主导供应链的这一部分,许多企业最终将使用反映中国价值观而非美国价值观的模型。

开放权重模型正在将基础模型层商品化。正如我之前所写,LLM 代币价格一直在快速下跌,开放权重助长了这一趋势,并为开发人员提供了更多选择。OpenAI 的 o1 每百万输出代币成本为 60 美元;DeepSeek R1 成本为 2.19 美元。这近 30 倍的差异让许多人注意到了价格下跌的趋势。

训练基础模型并销售 API 访问权的业务很艰难。该领域的许多公司仍在寻找收回模型训练巨额成本的方法。Sequoia 的文章“AI 的 6000 亿美元问题”很好地阐述了这一挑战(但需要明确的是,我认为基础模型公司做得很好,我希望他们能成功)。相比之下,在基础模型之上构建应用程序则带来了许多巨大的商机。既然其他人已经花费数十亿美元训练此类模型,您只需花费几美元就可以访问这些模型,以构建客户服务聊天机器人、电子邮件摘要器、AI 医生、法律文件助理等等。

扩大规模并不是 AI 进步的唯一途径。关于扩大模型规模作为推动进步的方式,人们大肆炒作。公平地说,我是扩大模型规模的早期支持者。许多公司通过制造这样的谣言筹集了数十亿美元:有了更多的资本,它们就可以 (i) 扩大规模和 (ii) 可预测地推动改进。因此,人们非常关注扩大规模,而不是采取更细致入微的观点,充分关注我们可以取得进步的许多不同方式。在一定程度上,在美国 AI 芯片禁运的推动下,DeepSeek 团队不得不在许多优化方面进行创新,以便在性能较差的 H800 GPU 而不是 H100 上运行,最终导致模型的训练(不包括研究成本)计算成本低于 600 万美元。

这是否真的会减少对计算的需求还有待观察。有时,降低每单位商品的价格可以带来更多美元用于购买该商品。我认为,从长远来看,对智能和计算的需求几乎没有上限,因此我仍然看好人类将使用更多智能,即使智能变得更便宜。

我在 X 看到了对 DeepSeek 进展的许多不同解读,就好像这是一个罗夏墨迹测试,让许多人将自己的意义投射到它上面。我认为 DeepSeek-R1 具有尚未解决的地缘政治影响。而且它对 AI 应用程序构建者来说也很棒。我的团队已经开始集思广益,这些想法之所以成为可能,只是因为我们可以轻松访问开放的高级推理模型。现在仍然是构建的好时机!

吴恩达介绍:

吴恩达,Andrew Ng,华裔美国人,斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达是人工智能和机器学习领域国际上最权威的学者之一。吴恩达也是在线教育平台Coursera的联合创始人(with Daphne Koller),DeepLearning.AI创始人。

2014年5月16日,吴恩达加入百度,担任百度公司首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。

2024年4月,亚马逊将吴恩达纳入其董事会。

相关内容

热门资讯

美媒:大脑芯片技术日渐成熟 参考消息网7月9日报道据美国石英财经网站7月7日报道,经过逾50年的研究,脑部植入技术已从实验室里的...
【特稿】美国教师要学AI 三大... 美国教师要学AI 三大美企联手培训 李贝阳 美国教师联合会8日在纽约市宣布,将与美国人工智能技术巨头...
黑林铺街道多社区联合开展红色阅... “没有共产党就没有新中国……”在黑林铺街道沙沟社区综合文化服务中心内,激昂嘹亮的歌声回荡,沙沟社区联...
山东恒亚申请车磨铣复合机床专利... 金融界2025年7月9日消息,国家知识产权局信息显示,山东恒亚机床制造有限公司申请一项名为“一种车磨...
原创 7... 月9日将成有史以来最短一天,科学奇观引发热议 在浩瀚的宇宙时间轴上,每一个瞬间都承载着独特的意义。而...
故宫博物院青少网站英文版、繁体... 故宫博物院青少网站英文版、繁体版上线暨2025年故宫-香港青年文化从业者“文化+科技训练营”开营仪式...
追火箭看排球听摇滚 文昌邀请各... 人民网海口7月9日电 (记者李学山)7月9日,由文昌市政府主办的“文昌是个好地方,邀您留一夏”202...
强化海洋战略科技力量 近日召开的中央财经委员会第六次会议提出,提高海洋科技自主创新能力,强化海洋战略科技力量。这有助于筑牢...
13.17秒跑完100米!全球... 7月7日消息,在浙江大学杭州国际科创中心(简称科创中心)首期开园五周年之际,科创中心人形机器人创新研...
飞书:发布多款AI产品,多行业... 【飞书召开AI产品发布会,发布升级多款产品助力企业AI落地】如今,AI大模型成不少人提效“神器”,但...
小红书不想只做一个「有用」的社... 文 | 阑夕 小红书的Slogan,变了。 从「你的生活指南」,改成了「你的生活兴趣社区」,虽然只是...
艾宝特智能取得电动直压开合模装... 金融界2025年7月8日消息,国家知识产权局信息显示,惠州市艾宝特智能科技股份有限公司取得一项名为“...
无人机“飞”进社区课堂 青少年... “机翼有正反,装反了小飞机可飞不起来哦!”在长安区太乙宫街道正街社区的活动室里,大学生志愿者正手把手...
贵阳这支算法团队,一年跻身西南... 日前,国际数据公司(IDC)最新报告显示,字节跳动旗下的豆包大模型在中国公有云大模型市场份额排名第一...
聚焦“天地一体”,中科曙光、中... 文 观察者网 武守哲 在全球空天竞争日趋激烈的背景下,7月8日,中科曙光与中科星图在合肥“2025空...
广州中慧上启科技靠谱吗? 在深化产教融合的国家战略推进中,广州中慧上启科技有限公司作为教育部备案的职业教育培训评价组织其教育软...
义乌太阳能风扇帽风靡海外市场 ... 央视网消息:随着全球多地气温持续走高,各类清凉小商品成为出口市场的爆款单品。截至7月初,这款走红海外...
济南园林集团与山东省互联网传媒... 记者 李萍 济南报道 7月9日,济南园林开发建设集团有限公司与山东省互联网传媒集团举行交流座谈会。济...
“本源悟空”引领:中国自主超导... 在科技领域,一场关于计算革命的新浪潮正在悄然兴起,其核心在于量子计算与人工智能的深度融合。这一趋势被...
漳州科华电气申请三电平变换器控... 金融界2025年7月9日消息,国家知识产权局信息显示,漳州科华电气技术有限公司申请一项名为“三电平变...