阿里开源千问3,参数量为DeepSeek-R1三分之一
创始人
2025-05-01 02:22:02
0

图片来源:界面图库

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(千问3),参数量为DeepSeek-R1的三分之一,成本大幅下降。据称,该模型性能全面超越R1、OpenAI-o1等领先模型,登顶全球最强开源模型。

千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

阿里巴巴表示,千问3系列支持119种语言,并基于近36万亿个token(标记)进行训练,使用的数据量是千问2.5的两倍。

千问3系列包括两个专家混合(MoE)模型和另外六个模型。阿里巴巴开源了两个MoE模型的权重:拥有2350多亿总参数和220多亿激活参数的Qwen3-235B-A22B,以及拥有约300亿总参数和30亿激活参数的小型MoE 模型Qwen3-30B-A3B。

阿里巴巴表示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,可媲美DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型

此外,六个Dense模型也已开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0许可下开源。

阿里巴巴表示,千问3代表了该公司在通往通用人工智能(AGI)和超级人工智能(ASI)旅程中的一个重要里程碑。未来,阿里计划从多个维度提升模型,包括优化模型架构和训练方法,以实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等关键指标

阿里巴巴集团CEO吴泳铭在今年2月的业绩会上表示,阿里集团在AI战略里面的首要目标是AGI(通用人工智能)的实现,可能远远超过现在可见的任何一个应用场景。

阿里巴巴预判如果实现AGI,人工智能相关产业大概率将会是全球最大的产业,有可能影响或者替代现在50%左右的GDP构成。

目前,包括谷歌在内的多家科技巨头推出了开源模型。今年3月,谷歌开源多模态大模型Gemma 3正式发布。这款仅需单块H100 GPU即可运行的27B参数模型,不仅性能对标谷歌闭源大模型Gemini 1.5 Pro,更以“低成本、高性能”的标签重新定义了行业标准。这一举措被业界视为谷歌在开源AI领域的一次重大战略升级。

今年3月底,OpenAI 宣布计划在今年发布自GPT-2以来的首个“开源”语言模型。据媒体报道,OpenAI的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者自由开启或关闭其“推理”功能。

相关内容

热门资讯

《荒野大镖客2》次世代版要来了... 据多方线索显示,R星可能正准备为旗下开放世界游戏《荒野大镖客2》推出次世代主机版本。玩家长期以来呼吁...
长江汽车电子取得一种显示屏结构... 金融界2025年7月11日消息,国家知识产权局信息显示,浙江长江汽车电子有限公司取得一项名为“一种显...
中外专家点评嫦娥六号样品研究进... 北京时间7月9日夜间,国际知名学术期刊《自然》以封面文章形式,上线发表中国科学家基于嫦娥六号采回月球...
上级媒体看盘锦 | 盘锦强化应... 7月4日,盘锦市兴隆台区惠宾街道康桥社区网格员胡嘉鑫收到一条手机短信:检测到消防占道,请登录移动千里...
海普洛斯满分通过欧洲权威室间质... 深圳商报·读创客户端记 郑恺 近日,欧洲分子基因诊断质量联盟(EuropeanMolecular G...
莫旗智慧养老信息服务调度指导中... 日前,莫旗智慧养老信息服务调度指导中心正式投入使用,这标志着莫旗在养老服务领域迈出了创新性的一步,开...
韦伯望远镜拍了 133 光年外... 嘿,朋友们!今天要和大家分享一个超酷的天文发现。最近,韦伯望远镜成功拍摄到了 133 光年外的行星,...
四川团队中标世界最大“人造太阳... 记者7月9日从核工业西南物理研究院获悉,世界最大的“人造太阳”项目——国际热核聚变实验堆(ITER)...
上海昌舆取得密封式上盖结构及管... 金融界2025年7月11日消息,国家知识产权局信息显示,上海昌舆塑料科技有限公司取得一项名为“密封式...
亚信安全:2025年推出5G云... 金融界7月11日消息,有投资者在互动平台向亚信安全提问:你好!请问贵公司在5G云网安全方面有哪些技术...
九识无人车海东市上路试运行 助... 7月10日下午,在海东市无人快递车首测启动仪式中,九识无人车正式上路试运行。作为海东市推进智慧城市建...
全新OPPO K13 Turb... OPPO官方今日正式宣布,将于7月21日举办全新K13Turbo系列新品发布会,即将发布全新K13T...
“功能替代”到“智能共创”——... 2025年7月9日,中科新松有限公司(以下简称“中科新松”)正式推出睿可(rico)系列的两款产品—...
曝折叠iPhone屏幕即将启动... 最近一段时间,关于苹果折叠iPhone的爆料大量出现,基于此也可以大致确定,这款全新的折叠屏机型真实...
欧盟公布最终版《通用人工智能行... 新华社布鲁塞尔7月10日电(记者张兆卿)欧盟委员会10日公布《通用人工智能行为准则》最终版本,旨在帮...
绿原酸-巯基,Chloroge... 绿原酸-巯基(Chlorogenic acid-SH)是一种通过化学修饰将巯基(-SH)引入绿原酸的...
苏格兰绿色漩涡,六年稳定运行,... 文︱陆弃 2025年夏,苏格兰一台海底潮汐涡轮机的“六年无故障运行”在能源界引发了一场轰动。这不是一...
三星将推出三折叠手机 一直流传于传闻中的三星三折叠手机,终于获得了官方的正式确认。在本周纽约的新品发布会期间,三星移动业务...
动态|2025索尼新品品鉴会上... 2025索尼新品品鉴会上海站 7月11日,索尼携手《家庭影院技术》杂志假座上海影音大师总部,举行20...
具身智能机器人亮相新能源车厂,... 在2025年这一被业界视为具身智能商业化突破的关键年份,一系列实地应用案例正不断涌现,其中,工业场景...