OpenAI CEO罕见认错:DeepSeek是非常好的模型,将考虑跟进开源!
创始人
2025-02-02 01:20:43
0

来源:芯智讯

北京时间2月1日凌晨,为应对DeepSeek-R1所带来的竞争,OpenAI正式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优。

△o3-mini与o1在AIME竞赛数学的得分对比

据介绍,o3-mini的价格比OpenAI o1-mini便宜63%,比满血版o1便宜93%。开发者可根据需求选择高、中、低三种推理强度,让o3-mini在处理复杂问题时进行深度思考,平衡速度和准确性。

具体来说,目前ChatGPT免费用户首次可以体验一个有限速率的o3-mini版本,速率限制与现有的 GPT-4o 限制类似;Plus用户可选择o3-mini-high更高智能版本;每月支付200美元的 Pro 用户可无限使用o3-mini和o3-mini-high;API层面,o3-mini输入1.10美元/百万token、输出4.40美元/百万token,价格比o1-mini便宜63%,比满血版o1便宜93%,但仍是GPT-4o mini的7倍左右。

OpenAI表示,o3-mini的发布是在追求高效能智能技术道路上的又一重要里程碑。通过优化科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)领域的推理能力,同时保持较低的成本,让高质量AI技术变得更加平易近人。

OpenAI联合创始人、首席执行官山姆·奥尔特曼在o3-mini发布后的在线问答中透露,“在未来几周,满血版o3即将上线。”

谈及对于DeepSeek的看法,奥尔特曼表示,“它(DeepSeek)确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。”

奥尔特曼还罕见地承认了自己的错误,并表示OpenAI正在讨论一个新的开源策略。“我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”

近期,中国AI技术厂商DeepSeek推出的V3和 R1 两款开源 AI 模型都颠覆了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。

也就是说,DeepSeek采用并不先进的AI芯片,以更低的算力要求和更低的成本,达到了OpenAI等美国AI技术厂商的顶级AI大模型的效果。这一成就被认为对美国的人工智能领导地位构成威胁,不仅引发了OpenAI、Meta、谷歌等众多大模型厂商恐慌,还引发了英伟达等AI芯片企业的价值重估和股价大跌。

然而,据SemiAnalysis,与外界认为DeepSeek公司拥有5万张H100 GPU计算卡看法不同,该机构认为,DeepSeek堆积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“特供版”H800、3万张“特供版”H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。DeepSeek 的总服务器资本支出约为 16 亿美元,运营此类集群的成本高达 9.44 亿美元。

但是,从DeepSeek官方公布的数据来看,其DeepSeek-V3/R1的训练仅用了约2080张英伟达H800加速卡,这部分的芯片投资大约为4000万美元左右。如果DeepSeek官方公布的数据无误,同时SemiAnalysis对于DeepSeek囤积了6万张英伟达GPU加速卡的分析也是正确的话,那么这也意味着DeepSeek现有的AI算力硬件足以支撑其后续研发多代性能更为强大的AI大模型。

编辑:芯智讯-浪客剑

相关内容

热门资讯

美媒:大脑芯片技术日渐成熟 参考消息网7月9日报道据美国石英财经网站7月7日报道,经过逾50年的研究,脑部植入技术已从实验室里的...
【特稿】美国教师要学AI 三大... 美国教师要学AI 三大美企联手培训 李贝阳 美国教师联合会8日在纽约市宣布,将与美国人工智能技术巨头...
黑林铺街道多社区联合开展红色阅... “没有共产党就没有新中国……”在黑林铺街道沙沟社区综合文化服务中心内,激昂嘹亮的歌声回荡,沙沟社区联...
山东恒亚申请车磨铣复合机床专利... 金融界2025年7月9日消息,国家知识产权局信息显示,山东恒亚机床制造有限公司申请一项名为“一种车磨...
原创 7... 月9日将成有史以来最短一天,科学奇观引发热议 在浩瀚的宇宙时间轴上,每一个瞬间都承载着独特的意义。而...
故宫博物院青少网站英文版、繁体... 故宫博物院青少网站英文版、繁体版上线暨2025年故宫-香港青年文化从业者“文化+科技训练营”开营仪式...
追火箭看排球听摇滚 文昌邀请各... 人民网海口7月9日电 (记者李学山)7月9日,由文昌市政府主办的“文昌是个好地方,邀您留一夏”202...
强化海洋战略科技力量 近日召开的中央财经委员会第六次会议提出,提高海洋科技自主创新能力,强化海洋战略科技力量。这有助于筑牢...
13.17秒跑完100米!全球... 7月7日消息,在浙江大学杭州国际科创中心(简称科创中心)首期开园五周年之际,科创中心人形机器人创新研...
飞书:发布多款AI产品,多行业... 【飞书召开AI产品发布会,发布升级多款产品助力企业AI落地】如今,AI大模型成不少人提效“神器”,但...
小红书不想只做一个「有用」的社... 文 | 阑夕 小红书的Slogan,变了。 从「你的生活指南」,改成了「你的生活兴趣社区」,虽然只是...
艾宝特智能取得电动直压开合模装... 金融界2025年7月8日消息,国家知识产权局信息显示,惠州市艾宝特智能科技股份有限公司取得一项名为“...
无人机“飞”进社区课堂 青少年... “机翼有正反,装反了小飞机可飞不起来哦!”在长安区太乙宫街道正街社区的活动室里,大学生志愿者正手把手...
贵阳这支算法团队,一年跻身西南... 日前,国际数据公司(IDC)最新报告显示,字节跳动旗下的豆包大模型在中国公有云大模型市场份额排名第一...
聚焦“天地一体”,中科曙光、中... 文 观察者网 武守哲 在全球空天竞争日趋激烈的背景下,7月8日,中科曙光与中科星图在合肥“2025空...
广州中慧上启科技靠谱吗? 在深化产教融合的国家战略推进中,广州中慧上启科技有限公司作为教育部备案的职业教育培训评价组织其教育软...
义乌太阳能风扇帽风靡海外市场 ... 央视网消息:随着全球多地气温持续走高,各类清凉小商品成为出口市场的爆款单品。截至7月初,这款走红海外...
济南园林集团与山东省互联网传媒... 记者 李萍 济南报道 7月9日,济南园林开发建设集团有限公司与山东省互联网传媒集团举行交流座谈会。济...
“本源悟空”引领:中国自主超导... 在科技领域,一场关于计算革命的新浪潮正在悄然兴起,其核心在于量子计算与人工智能的深度融合。这一趋势被...
漳州科华电气申请三电平变换器控... 金融界2025年7月9日消息,国家知识产权局信息显示,漳州科华电气技术有限公司申请一项名为“三电平变...