DeepSeek V3.1升级:Agent能力跃升,混合推理模式上线,价格有所调整
创始人
2025-08-22 20:21:08
0

在科技界的翘首以盼中,虽然备受瞩目的R2模型未能如期亮相,但DeepSeek团队却适时推出了其最新力作——V3.1模型。此次发布虽从版本号上看似一次小幅迭代,实则标志着DeepSeek在智能体技术领域的又一重要进展。

DeepSeek官方将V3.1誉为“智能体时代的初探”,强调了该模型在Agent能力、思考模式及效率上的三大飞跃。通过精心设计的后训练优化策略,V3.1在工具运用及智能体任务中的表现显著提升,特别是在编程智能体与搜索智能体的测评中,相较于前代模型,展现出了更为卓越的能力。

V3.1采用了创新的混合推理架构,这一设计使得模型能够在思考模式与非思考模式间灵活切换,满足了不同场景下的需求。用户现已可在DeepSeek的官方App与网页端体验这一功能,通过简单的“深度思考”按钮,即可轻松切换模式。同时,DeepSeek API也完成了同步升级,deepseek-chat专注于快速响应的非思考模式,而deepseek-reasoner则专注于深度思考的思考模式,且两者的上下文容量均扩展至128K。

用户对于V3.1的混合推理架构反响热烈,认为这一设计完美平衡了深度思考与快速响应的需求,预示着实用人工智能的美好未来。一位网友评论道:“在深度推理与快速反应间自由切换,这一创意堪称天才之举。”

在提升思考能力的同时,V3.1也注重效率的优化。官方数据显示,V3.1-Think在保持与DeepSeek-R1-0528相当答案质量的同时,响应速度更快。经过思维链压缩训练,V3.1-Think在减少20%-50%输出token数的情况下,各项任务表现依然稳健。

V3.1在非思考模式下的输出长度也得到了有效控制,相较于DeepSeek-V3-0324,在输出长度显著减少的同时,模型性能依然保持不变。值得注意的是,随着V3.1的推出,DeepSeek也对API接口调用价格进行了调整。自9月6日起,取消了夜间时段优惠,输入价格调整为缓存命中时0.5元/百万tokens,缓存未命中则为4元/百万tokens(此前V3为2元/百万tokens);输出价格则上调至12元/百万tokens(此前V3为8元/百万tokens)。

在技术层面,V3.1的基础模型在V3的基础上进行了外扩训练,新增了840B tokens的训练数据。这些基础模型与后训练模型均已在Huggingface与魔搭平台上开源,供开发者与研究者使用。DeepSeek此次还宣布了对海外模型Anthropic API格式的支持,用户可以将V3.1的能力无缝接入Claude Code框架,进一步拓宽了模型的应用场景。

相关内容

热门资讯

雷军底牌金山,再次进入爬坡期 文|斑马消费 任建新 从2010年创立小米,到2021年“最后一次创业”造车,雷军再度实现跃升。那...
原创 大... 第一关:能量消耗——蛇是“五菱宏光”,虎狮是“悍马油老虎” 大连蛇岛的黑眉蝮蛇,把“节能”刻进了DN...
新时代文明实践|在嘉年华中,一... 8月20日,桐乡市新时代文明实践中心联合百乐社区新时代文明实践站,组织20余组亲子家庭前往乌镇世界互...
魅族22宣布延期至9月:对不起... 今天上午,魅族科技官方发文宣布新机魅族 22 再度跳票,但承诺“事不过三”。官方表示:“对不起,接受...
青岛成功举办“数智低空 赋能未... 8月20日,青岛市通信行业联合市发改委、工信局、交通等多个部门,携手低空经济领域重点企业,在城阳区成...
陕西省知识产权局来石调研 8月22日下午,陕西省知识产权局一行6人与河北省市场监督管理局(知识产权局)有关负责同志,共同到我市...
第九个全国残疾预防日:听力残疾... 2025年8月25日是第九个全国残疾预防日,今年的主题是“预防伤害致残,共创健康生活”。 一、听力...
江苏加速打造重大创新平台矩阵 来源:滚动播报 (来源:江苏省广播电视总台) 重大创新平台是推进高水平科技自立自强的基座。近年来,江...
辽宁构建多维度全链条地震安全服... 央广网沈阳8月22日消息(记者李子平 实习记者王茗赫)建成全国首个地震云平台、建成非天然地震监测平台...
【冀观察】河北本土资源如何育出... 今年6月,河北省邯郸市复兴区的一所小学热闹非凡。无人机在“山峰峡谷”模型间穿梭接力,一群“小工程师”...
国乐撞见数字浪潮:屏上三十秒,... 012025年7月上海合作组织媒体智库峰会上,《合乐图》民族乐器复刻展演引发关注,展现国乐与现代科技...
谷歌计算器应用9.0重磅更新:... IT之家 8 月 22 日消息,科技媒体 Android Authority 今天(8 月 22 日...
广州银发经济领域企业突破1.8... 中新网广州8月22日电 (记者 蔡敏婕)第九届中国(广州)国际养老健康产业博览会(以下简称“广州老博...
DeepSeek V3.1升级... 在科技界的翘首以盼中,虽然备受瞩目的R2模型未能如期亮相,但DeepSeek团队却适时推出了其最新力...
智能化改造+数字化转型,深圳坪... 深圳新闻网2025年8月22日讯(记者 张金)携带公司“绝招”亮相中博会,“收获超出想象”;联手数据...
人类是被圈养的动物?太阳系有四... 在太阳系的形成和演化理论中,太阳系终有一天会灭亡。科学家预测,大约50亿万年后,现在表面温度达到55...
AI催化智能制造市场百亿扩容,... 近日,中邮证券发布研报称AI从商业和产业价值两方面赋能制造业,25 年人工智能制造业应用在我国市场规...
俄发布月球探测新时间表:“月球... 当地时间8月22日,俄罗斯科学院院长克拉斯尼科夫表示,俄罗斯下一次月球探测任务将于2028年实施,届...
国赛摘金!安徽学子在全国青少年... 8月14日至18日,第九届全国青少年无人机大赛在重庆火热举行。赛事由中国航空学会主办,吸引了全国近6...
【人工智能】2025年人工智能... 项目简介 人工智能应用工程师课程是一套集专业化知识架构、科学化培养路径、系统化考核标准于一体的高端...