马斯克发布Grok3:多项测试超越DeepSeek,展现强劲竞争力
创始人
2025-02-18 16:20:40
0

转载自《AI范儿》

xAI今日发布新一代大语言模型Grok-3及其精简版Grok-3 mini。最新基准测试显示,Grok-3在与DeepSeek的直接对比中展现出显著优势。

在数学能力测试(AIME'24)中,Grok-3获得52分,明显超过DeepSeek-V3的39分。科学知识评估(GPQA)方面,Grok-3以75分的成绩领先,而DeepSeek-V3为65分。在编程能力测试(LCB Oct-Feb)中,Grok-3同样以57分超过DeepSeek-V3的36分。

最新公布的AIME 2025性能测试中,Grok-3 Reasoning Beta版本在推理和计算时间复合评分上取得93分的优异成绩,其精简版本Grok-3 mini也达到了90分。相比之下,DeepSeek-R1的得分为75分,而Gemini-2 Flash Thinking仅为54分。这一结果进一步凸显了Grok-3在复杂数学推理和计算效率方面的突出优势。

特别值得注意的是,DeepSeek近期发布的DeepSeek-R1在其他推理能力测试中也未能赶超Grok-3。在数学推理中,Grok-3获得93分,DeepSeek-R1为73分;科学推理中,Grok-3得分85分,DeepSeek-R1为74分;编程推理中,Grok-3达到79分,而DeepSeek-R1为65分。

此外,在LMSYS聊天机器人竞技场评估中,Grok-3的得分约为1400分,不仅超过了DeepSeek系列,也领先于其他主流大模型,包括GPT-4、Claude等。

这些数据表明,尽管DeepSeek在过去几个月展现出强劲的发展势头,但Grok-3的整体性能仍然保持领先地位。特别是在数学推理和计算效率方面的优势更为明显,这不仅体现了xAI在模型研发上的技术实力,也显示出AI领域竞争的白热化程度。

相关内容

热门资讯

水产品药残检测设备:科技守护舌... 水产品药残检测设备是保障水产品质量安全的关键工具,主要基于酶联免疫吸附法(ELISA)和胶体金免疫层...
马斯克带头加班 通宵在办公室搭... 快科技7月1日消息,近日,马斯克在推文中表示,他正通宵达旦地开发Grok 4,并称“进展良好”。 不...
马斯克公布脑机接口重大成果,未... 在硅谷科技圈的聚光灯下,埃隆·马斯克(Elon Musk)再次以一场震撼全球的发布会,将人类对脑机接...
描绘智能未来新图景——聚焦福州... 坐上自动驾驶网约车,车外风景宜人,车速不疾不徐;车内无需人工操作,智慧大屏清晰显示车辆情况和路况信息...
原创 南... 这几年,中国在南海默默干了一件大事。 把一块块不起眼的礁石,变成了真正的海上岛屿。 修机场、建码头、...
新一代智能船舶“新红专”轮抵琼... 海口7月1日电(记者 王子谦)7月1日上午,全球首艘智能研究与教学实训两用船“新红专”轮靠泊海口新海...
华为申请一种数据处理方法及其装... 金融界2025年7月1日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“一种数据处理方法...
上海雍邑光电取得光斑角度测量装... 金融界2025年7月1日消息,国家知识产权局信息显示,上海雍邑光电科技有限公司取得一项名为“光斑角度...
原创 力... 在力诺药包三期中硼硅模制瓶车间里,一炉三线的全自动、智能化生产线正在生产模制瓶产品,包括容量5-50...
浙江赛灵特取得水力驱动装置及水... 金融界2025年7月1日消息,国家知识产权局信息显示,浙江赛灵特泵业科技有限公司取得一项名为“水力驱...
展讯半导体申请通信方法相关专利... 金融界2025年7月1日消息,国家知识产权局信息显示,展讯半导体(南京)有限公司申请一项名为“通信方...
大折叠主力机时代来临了!viv... 自大折叠诞生以来,两个重要的问题就如同达摩克利斯之剑悬于大折疊之上:如何让折叠屏更轻薄,如何让折叠屏...
格力朱磊:中国制造全球 85%... IT之家 6 月 29 日消息,据凤凰网财经报道,6 月 28-29 日,“2025 中国企业出海高...
Meta重组其人工智能部门,成... 通信世界网消息(CWW)据外媒报道,MetaCEO马克・扎克伯格宣布对公司人工智能部门进行重组,成立...
原创 无... 无人机拍摄的影像从横屏(水平方向)改为竖屏(垂直方向)是否会损失像素,这个问题涉及到多个方面的考量,...
“涪陵造”新能源变压器接入新疆... 近日,新疆喀什疏附80万千瓦光伏发电项目实现全容量并网发电。涪陵高新技术企业重庆南瑞博瑞变压器有限公...
退休是不可能的!董明珠承诺将为... 日前,格力电器 2024 年度股东大会于珠海顺利召开。会上格力电器董事长董明珠亲临现场,公司董事、总...
雄安未来之城场景汇丨融合创新,... 92项前沿技术亮相低空交通创新技术应用大赛决赛 融合创新,低空交通加速“飞”进生活 6月29日,第...
我科学家揭示 阿尔茨海默病早期... 6月26日,记者从中国科学院昆明动物研究所获悉,该所研究员姚永刚、张登峰带领团队,解析了阿尔茨海默病...
泉美智能取得智能仓储细胞培养箱... 金融界2025年7月1日消息,国家知识产权局信息显示,泉美智能科技(山东)有限公司取得一项名为“一种...