DeepSeek官宣R1升级:提升思维深度与推理能力,整体表现已接近国际顶尖模型
创始人
2025-05-30 00:01:09
0

国产大模型公司深度求索(DeepSeek)发布详细的升级公告,解释DeepSeek-R1升级的具体情况。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

DeepSeek表示,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。

在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

据公告称,当前模型的测评成绩与OpenAI o1-high相当,但与o3-High以及Claude4 Sonnet仍有差距。

此次 R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。与旧版本的DeepSeek-R1保持一致,此次升级仍为开源模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

此前5月28日,DeepSeek在官方微信群发布消息称,DeepSeekR1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。

据网友测评显示,此次升级效果令人惊艳。从社交媒体的反馈来看,网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

相关内容

热门资讯

PS会员越来越贵,索尼:订的人... 这次涨价也让PLUS会员价达成了新“里程碑”。以港服会员价格为例,三档会员的年费售价已达一千港币,二...
建科智能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示建科智能(300823)新获得一项实用新型专利授权,专利名为“...
浙江乘屹智能装备取得钢带卷抓手... 金融界2025年6月26日消息,国家知识产权局信息显示,浙江乘屹智能装备有限公司取得一项名为“钢带卷...
生成式AI“未保”怎么做?专家... 生成式人工智能正迅速进入未成年人的数字生活,渗透学习辅助、社交陪伴等场景。与此同时,AI绘画软件随意...
突发!小米辟谣YU7大定5分钟... 最新消息显示,小米集团公关部总经理王化最新辟谣称,虽然今晚(6月26日)小米YU7的成绩非常亮眼超出...
原创 v... 华为在折叠屏手机市场的地位确实不可动摇,今年一季度以77%的市场份额遥遥领先于竞争对手。 据说在折叠...
把“性价比”刻进火箭DNA里 ... “活力中国调研行”主题采访活动这两天持续在北京开展。其中,北京商业航天创新发展成为记者关注的一个热点...
原创 伊... 文/珠玑说 (本文所有内容皆有官方可靠信源,具体资料赘述文章结尾) 伊朗最近展开了一场全国范...
江西车仆取得机油快速检测装置专... 金融界2025年6月26日消息,国家知识产权局信息显示,江西车仆实业有限公司取得一项名为“一种机油快...
洛克机械取得一种翻箱机构专利,... 金融界2025年6月26日消息,国家知识产权局信息显示,洛克机械(天津)有限公司取得一项名为“一种翻...
中国电信河北保定分公司推动营维... 近年来,随着用户需求从单一向多元、从主动到店向居家购物的转变,信息通信行业面临更高要求。面对用户需求...
吉林大华取得智能化管理系统装置... 金融界2025年6月26日消息,国家知识产权局信息显示,吉林大华科技集团有限公司取得一项名为“一种智...
中建八局一公司取得一种基坑监测... 金融界2025年6月26日消息,国家知识产权局信息显示,中建八局第一建设有限公司取得一项名为“一种基...
从夏季达沃斯论坛上看智能科技驱...   6月26日,在国家会展中心(天津),Workera创始人兼首席执行官卡坦福鲁什(右二)在分论坛发...
小米科技生态站上新起点:首款S... 6月26日,小米人车家全生态发布会在北京召开,小米集团创始人、董事长兼CEO雷军宣布小米汽车旗下首款...
广西灵山荔枝园引入AI无人机,... 在广西灵山县,一场由人工智能引领的农业变革正在悄然上演。这里,42万亩的荔枝园不仅承载着千年的种植历...
两次失败后,澳首枚国产自研火箭... 澳洲首枚国产自研火箭即将在一周内发射升空。Gilmour Space Technologies已确 ...
售货机物联卡全天候稳定在线秘籍... 在智能化零售领域,售货机物联卡的稳定性是确保设备高效运行的关键。为此,我们必须从物联卡的选择、硬件优...
北京132款大模型备案上线 数... 中新网北京6月26日电 (记者 吕少威)记者26日从北京“两区”建设五周年系列新闻发布会数字经济专场...
“天关”卫星发现新型暂现X射线... “天关”卫星发现新型暂现X射线天体 记者今天(26日)从中国科学院国家天文台获悉,中国科学院主导的...