Claude 3.7 Sonnet:全球首个混合推理模型,网友盛赞其丝滑表现与编程能力
创始人
2025-02-25 16:41:20
0

近日,人工智能领域迎来了一项重大突破,Anthropic公司正式推出了其最新版本的模型——Claude 3.7 Sonnet。该模型被Anthropic官方誉为迄今为止最智能的模型,同时也是市场上首个混合推理模型。

Claude 3.7 Sonnet的特别之处在于,它不仅能够提供近乎即时的响应,还能在扩展思考模式下,向用户直观展示其长时间的逐步思考过程。这一功能使得API用户可以根据需要,对模型的思考时长进行精细控制,从而在保证响应速度的同时,获得更深层次的思考结果。

Anthropic公司表示,Claude 3.7 Sonnet的开发理念与市场上其他推理模型截然不同。他们认为,推理能力应当是前沿模型的集成能力,而非一个完全独立的模型。正如人类使用同一个大脑进行快速反应和深度思考一样,Claude 3.7 Sonnet也集成了普通大型语言模型与推理模型的功能,为用户创造了更无缝的体验。

在价格方面,Claude 3.7 Sonnet保持了与之前版本相同的定价标准,无论是标准模式还是扩展思考模式,都是3美元/每百万输入token,15美元/每百万输出token,这一费用已经包含了思考token的消耗成本。

Claude 3.7 Sonnet的推出,标志着Anthropic公司在人工智能推理领域取得了重大进展。该模型不仅在数学、物理、指令遵循、编程等多领域表现出色,还在编码和前端网页开发领域展现了尤为突出的改进。同时,Anthropic还推出了专为代理式编码设计的命令行工具Claude Code,使开发者能够直接在终端界面上将大量工程任务委派给Claude来完成。

值得注意的是,Claude 3.7 Sonnet的扩展思考模式并非通过切换到不同策略模型来实现,而是让同一个模型拥有更多思考时间和计算资源。这种“动作扩展”的增强能力,使得Claude能够迭代式调用函数、响应环境变化,并持续执行直到完成开放式任务。在计算机操作等任务中,Claude 3.7 Sonnet可以分配更多操作轮次和更长时间与算力资源,从而取得更出色的执行结果。

Anthropic还将Claude的扩展思考模式与智能体训练相结合,在游戏等场景应用中实现了突破性提升。以运行Game Boy经典游戏《Pokémon Red》为例,Claude 3.7 Sonnet成功挑战了三位宝可梦道馆馆主并赢得徽章,展现了其通过多策略验证与预设条件动态修正机制,在游戏进程中持续优化自身行为能力的能力。

在性能对比方面,Claude 3.7 Sonnet也表现出色。在扩展思考模式下,该模型在研究生级推理任务上实现了78.2%的准确率,挑战了OpenAI的最新模型,并超越了DeepSeek-R1。在数学解题方面,Claude 3.7 Sonnet 64K扩展思考模型的表现也优于其前代产品以及其他主流模型。

Claude 3.7 Sonnet的发布在Hacker News上引发了热议。用户们纷纷赞扬其简洁易用以及在学习和工作中的巨大帮助。特别是在编程方面,Claude的优势尤为明显,甚至改变了许多用户的生活和工作方式。有用户表示,Claude Code不依赖于检索增强生成(RAG),能够直接看到所有内容,并以更高质量的方式回复,这大大提高了编程效率。

就在Claude 3.7 Sonnet发布之际,阿里云Qwen团队也推出了全新推理模型系统“深度思考(QwQ)”。该系统在数学解析、代码生成和智能体开发等领域也展现出了显著提升的认知能力与创新思维。这一巧合使得两大人工智能巨头在推理模型领域再次上演了“隔空对狙”的戏码。

QwQ系统整合了深度推理引擎和实时网络信息检索接口,采用了类似Claude Artifacts的多窗口界面方案,并支持图像合成、动态二维码生成、实时气象数据获取等多样化服务。开发团队透露,正式版QwQ-Max将同步推出移动端应用程序,并计划依据Apache 2.0开源协议向技术社区开放模型参数。

随着Claude 3.7 Sonnet和QwQ等推理模型的推出,人工智能领域正迎来一场前所未有的变革。这些模型不仅在性能上取得了重大突破,还在学习、工作、编程等多个方面为用户提供了巨大的便利和帮助。未来,随着技术的不断发展和完善,我们有理由相信,人工智能将在更多领域展现出其无限的可能性和潜力。

相关内容

热门资讯

安洁科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示安洁科技(002635)新获得一项发明专利授权,专利名为“一种...
2015年6月28日:猎鹰9号... 今日6月28日 一枚身价数千万美元的火箭,在佛州晴空下炸成碎片。而这一切,只因为一个不到百元的零...
剪草坪的欧洲中产白男,被中国公... 出品|虎嗅商业消费组 作者|周月明 编辑|苗正卿 题图|Navimow 在电影《怦然心动》中有一个桥...
华中最大自动化农作物种质资源库... 原标题:智能机器人巡守湖北超级“种子银行” 华中最大自动化农作物种质资源库试运行 “JYH01……”...
英威腾获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示英威腾(002334)新获得一项发明专利授权,专利名为“一种工...
格力电器获得发明专利授权:“烹... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“烹饪...
山东机器人产业:2027年规模... 【山东印发机器人产业发展计划,力争2027年产业规模破500亿】日前,山东省工信厅等25部门联合印发...
国家能源集团:千亿级发电行业大... 据国家能源集团消息:今日,国家能源集团正式发布千亿级发电行业大模型——“擎源”发电大模型。该模型以“...
“科学学全球伙伴计划”搭建全球... 近日,在“浦江创新论坛——科学学上海论坛·2025科技创新智库国际研讨会”现场,“科学学全球伙伴计划...
永祥硅材料取得硅芯包装平台专利... 金融界2025年6月28日消息,国家知识产权局信息显示,四川永祥硅材料有限公司取得一项名为“一种硅芯...
迈金科技取得一种电子变速器专利... 金融界2025年6月28日消息,国家知识产权局信息显示,青岛迈金智能科技股份有限公司取得一项名为“一...
珠海冠宇获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示珠海冠宇(688772)新获得一项发明专利授权,专利名为“一种...
小火龙拜访土星朋友之旅 ■西安经开第七小学四年级一班 宋佳骏 在浩瀚的宇宙中,在有着八大行星的太阳系中,在美丽的地球上,居住...
汇智聚力优化创新生态 近年来,上海以建设国际科技创新中心为战略使命,聚焦强化科技创新策源功能主线,从政策赋能、机制突破、未...
学术破界,科普惠民,这场医学大... 6月28日,首届“浦江-明道”普外学术大会暨“浦公英”健康科普驿站普外专场在上海举办。这场以“学术引...
珠海冠宇申请一种极片及电池专利... 金融界2025年6月28日消息,国家知识产权局信息显示,珠海冠宇电池股份有限公司申请一项名为“一种极...
小米申请充电控制相关专利,提高... 金融界2025年6月28日消息,国家知识产权局信息显示,北京小米移动软件有限公司申请一项名为“充电控...
AI技术赋能 西安音乐项目获文... 文化和旅游部科技教育司、全国艺术科学规划领导小组办公室近日公布了17项2025年度国家社科基金艺术学...
这一星象时隔36年再现,明晚记... 6月29日,太阳系中的行星海王星与土星相合,上演“星星相吸”。届时如果天气晴好,我国感兴趣的公众可在...
双向奔赴!乐源智慧农业产业园在... 6月28日,乐源智慧农业产业园开工奠基仪式在重庆市武隆区白马工业园区举行。项目的落地,为武隆工业经济...