阿里开源千问3,参数量为DeepSeek-R1三分之一
创始人
2025-05-01 02:22:02
0

图片来源:界面图库

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(千问3),参数量为DeepSeek-R1的三分之一,成本大幅下降。据称,该模型性能全面超越R1、OpenAI-o1等领先模型,登顶全球最强开源模型。

千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

阿里巴巴表示,千问3系列支持119种语言,并基于近36万亿个token(标记)进行训练,使用的数据量是千问2.5的两倍。

千问3系列包括两个专家混合(MoE)模型和另外六个模型。阿里巴巴开源了两个MoE模型的权重:拥有2350多亿总参数和220多亿激活参数的Qwen3-235B-A22B,以及拥有约300亿总参数和30亿激活参数的小型MoE 模型Qwen3-30B-A3B。

阿里巴巴表示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,可媲美DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型

此外,六个Dense模型也已开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0许可下开源。

阿里巴巴表示,千问3代表了该公司在通往通用人工智能(AGI)和超级人工智能(ASI)旅程中的一个重要里程碑。未来,阿里计划从多个维度提升模型,包括优化模型架构和训练方法,以实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等关键指标

阿里巴巴集团CEO吴泳铭在今年2月的业绩会上表示,阿里集团在AI战略里面的首要目标是AGI(通用人工智能)的实现,可能远远超过现在可见的任何一个应用场景。

阿里巴巴预判如果实现AGI,人工智能相关产业大概率将会是全球最大的产业,有可能影响或者替代现在50%左右的GDP构成。

目前,包括谷歌在内的多家科技巨头推出了开源模型。今年3月,谷歌开源多模态大模型Gemma 3正式发布。这款仅需单块H100 GPU即可运行的27B参数模型,不仅性能对标谷歌闭源大模型Gemini 1.5 Pro,更以“低成本、高性能”的标签重新定义了行业标准。这一举措被业界视为谷歌在开源AI领域的一次重大战略升级。

今年3月底,OpenAI 宣布计划在今年发布自GPT-2以来的首个“开源”语言模型。据媒体报道,OpenAI的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者自由开启或关闭其“推理”功能。

相关内容

热门资讯

华升鑫取得抗变形的组合式PCB... 金融界2025年5月3日消息,国家知识产权局信息显示,深圳市华升鑫科技有限公司取得一项名为“种抗变形...
漫评:青年一代挺膺担当,书写“... “青春须早为,岂能长少年”。随着五四青年节的到来,广大青年再次成为社会各界关注的焦点。新时代的中国青...
浙江杭州:匠心点亮万家灯火 4月29日,刚参加完庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会的倪萍,又回到...
我国应用无人平台远程开发的海上... 新华社深圳5月3日电作为应用无人平台远程开发的海上稠油油田,中国海油深圳分公司番禺11-12平台3日...
拥抱智算!中兴通讯智算服务器订... 近年来,以ChatGPT为代表的大模型爆发性增长,带动了智能算力需求飙升,一座座智算中心拔地而起,部...
华为申请到达角测量方法等专利,... 金融界2025年5月3日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“到达角测量方法、...
巴菲特官宣退休,苹果CEO发文... 2025年5月3日,94岁的“股神”沃伦·巴菲特在伯克希尔·哈撒韦年度股东大会上宣布,将于年底正式退...
第二十三届太原煤炭(能源)工业... 以“绿色智能 引领未来”为主题的第二十三届太原煤炭(能源)工业技术与装备展览会日前在山西潇河国际会展...
芭田股份获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示芭田股份(002170)新获得一项发明专利授权,专利名为“一种...
如何让微信CRM精准降本又增效... 内容概要 在数字化转型浪潮中,微信CRM正成为企业降本增效的"秘密武器"。通过企业微信与智能工具的深...
三星显示申请显示设备专利,可提... 金融界2025年5月3日消息,国家知识产权局信息显示,三星显示有限公司申请一项名为“显示设备”的专利...
原创 原... 欧洲有一个科学家卡尔达诺曾预测自己的死亡日期,到了日期那一天,他自杀了,实现了自己的预言。 卡尔达诺...
方大控股取得复合布齿冲击钻头专... 金融界2025年5月3日消息,国家知识产权局信息显示,方大控股有限公司取得一项名为“一种复合布齿冲击...
雪神造雪设备取得造雪机用喷水环... 金融界 2025 年 5 月 3 日消息,国家知识产权局信息显示,雪神造雪设备(北京)有限责任公司取...
卷积神经网络:从图像识别到智能... 在人工智能的璀璨星河中,卷积神经网络(Convolutional Neural Network, C...
AI动力腿为爬山开“外挂” 湖北日报全媒记者 蔡俊 通讯员 赵盛迷 杨绍湫 “五一”假期,恩施大峡谷景区准备的近50套登山助力外...
账号遇险?Steam账号找回方... Steam账号被盗或忘记密码,对玩家来说无疑是场“灾难”。想象一下,你辛苦攒下的游戏库、好友列表,甚...
原创 技... 前言 4月30号下午,我国神舟十九号三名航天员安全落地,但是在宇航员出舱的时候,三位航天员皆是由工...
杭萧钢构取得临时支撑架专利,有... 金融界2025年5月3日消息,国家知识产权局信息显示,杭萧钢构股份有限公司取得一项名为“一种临时支撑...
【一周连连看】AI重构教育公司... 来源|多知 Hi,节日快乐~在刚刚过去的这一周,教育科技行业依然保持着勃勃生机。在本篇中你将看到: ...