DeepSeek官宣R1升级:提升思维深度与推理能力,整体表现已接近国际顶尖模型
创始人
2025-05-30 00:01:09
0

国产大模型公司深度求索(DeepSeek)发布详细的升级公告,解释DeepSeek-R1升级的具体情况。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

DeepSeek表示,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。

在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

据公告称,当前模型的测评成绩与OpenAI o1-high相当,但与o3-High以及Claude4 Sonnet仍有差距。

此次 R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。与旧版本的DeepSeek-R1保持一致,此次升级仍为开源模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

此前5月28日,DeepSeek在官方微信群发布消息称,DeepSeekR1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。

据网友测评显示,此次升级效果令人惊艳。从社交媒体的反馈来看,网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

相关内容

热门资讯

山东北辰公布“一种核电换热器用... 天眼查APP显示,近日,山东北辰机电设备股份有限公司申请的“一种核电换热器用横缝焊接装置”专利公布。...
脑机接口新技术助力精准识别肿瘤... 近日,中国科学院空天信息创新研究院(空天院)传感器技术全国重点实验室与哈尔滨医科大学附属第一医院(哈...
AI智取云计算 大模型打开了AI云的增长时间窗口,处在关键节点的云计算市场正经历着深刻的变化。 整体上看,云计算逐渐...
华为Mate XTs三折叠开启... 今天(8 月 28 日)上午,@华为终端 发布 Mate XTs 非凡大师三折叠手机的预热视频。视频...
韦伯望远镜揭秘:超大质量黑洞“... 近日,天文学界迎来了一项震撼人心的发现——詹姆斯·韦伯空间望远镜成功捕捉到了超大质量黑洞的“初生瞬间...
科学与健康|脑机接口新技术助力... 近日,中国科学院空天信息创新研究院(空天院)传感器技术全国重点实验室与哈尔滨医科大学附属第一医院(哈...
Aethir与亚利桑那州立大学... 近日,去中心化云计算领域的佼佼者Aethir宣布与亚利桑那州立大学(ASU)携手,共同推出了一项具有...
道和通泰华为携手,空地集群智慧... 在贵阳这座充满活力的城市,2025中国国际大数据产业博览会(数博会)于8月末盛大启幕,汇聚了全球大数...
马来西亚顶尖机器人科学家移居中... 【文/观察者网 柳白】 中国海洋科技的迅猛发展,正实现从无到有、从弱到强的“蝶变”,我国不断释放人...
我国科学家在6G无线通信领域取... 我国科学家近日成功研制出超宽带光电融合集成系统,首次实现全频段、灵活可调谐的高速无线通信,有望为未来...
耶鲁等团队联合发布首个虚拟细胞... 首个能够从零开始自动化设计和生成虚拟细胞模型的多智能体系统来了! 近日,美国耶鲁大学马克·格斯坦(M...
亿算智能国产万卡推理集群算力利... “目前,我们机柜服务器上架率已经达到100%,主要客户有无问芯穹、美团及一些头部互联网企业,日常国产...
“十四五”期间科技工作干了啥?... 人民网南昌8月28日电 (记者罗娜)“五年来,我们以科技兴赣六大行动为抓手,取得一批突破性进展和标志...
超硬核!我国6G无线通信领域取... 2025年政府工作报告首次明确提出“培育6G等未来产业”,标志着6G正式成为国家战略布局的重要组成部...
小程序开发公司哪家好?北京网络... 小程序开发公司哪家好?北京网络开发靠谱公司推荐 在北京想找家靠谱的小程序开发公司,真得好好琢磨琢磨。...
百度造了个“AI星舰”?或成业... 编辑 | 王玮 构建一系列能在生产环境中落地的 Agent,远比想象中复杂。 从模型选择上来看,A...
伟星股份公布“一种耐高温阻燃模... 天眼查APP显示,近日,浙江伟星实业发展股份有限公司申请的“一种耐高温阻燃模压钮扣及其制作工艺”专利...
贵州省委书记徐麟会见出席202... 8月27日,贵州省委书记徐麟在贵阳会见了出席2025中国国际大数据产业博览会的360集团创始人周鸿祎...
微创医疗时代下的“隐形推手”:... 全球医疗产业正加速向高质量与多元化发展,其中微创技术的广泛应用正在推动临床诊疗方式持续优化。作为关键...
西安小程序定制开发多少钱,费用... 西安小程序定制开发需要多少钱?现在小程序的发展特别好,有的一些企业想要做一款属于自己的小程序,那么就...