阿里云发布通义千问2.5,赶超GPT-4,千问110B成为全球最强开源大模型
创始人
2024-05-10 00:28:22
0

原标题:阿里云发布通义千问2.5,赶超GPT-4,千问110B成为全球最强开源大模型

5月9日,通义大模型发布一周年之际,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为全球开源领域最强大模型。

Open LLM LeaderBoard截图

技术依然是阿里云在AI时代保持领先的最强武器

大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。

官方提供

同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首,再度证明通义开源系列业界最强的竞争力。

通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型,也是国内用户规模第一的智能编码助手通义灵码的底座。

Big Code截图

一年间,通义还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。大会当日,原通义千问APP宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。

坚定开源路线,成为全球最强开源大模型

去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮,让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

为顺应不同场景用户需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。

Hugging Face截图

长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

百炼平台2.0全面升级,提供大模型最强外挂

百炼平台从模型开发、应用开发到算力底座全面升级,更加易用、更加开放,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。

2023年10月,阿里云发布了百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。本次大会上,百炼升级成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好地支持大型企业和成熟开发者的需求。

官方提供

“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。”周靖人介绍。

对希望直接调用模型进行推理的企业,百炼集成了上百款大模型api,除了通义、Llama、ChatGLM等系列,还首家托管百川等系列三方模型,覆盖国内外主流厂商,联动魔搭开源社区,同时支持企业上架通用或行业模型,给开发者提供足够多的模型选择。同时,百炼依托阿里云AI基础设施,支持千亿级模型的万级并发推理,充分满足企业需求。

针对需要进一步训练模型的用户,百炼提供了从数据管理、模型调优、评测到部署的全链路模型服务,用户可按需弹性调用算力,无需担心底层架构。训练过程可视化,还可自动评测模型质量,并与其他模型进行对比。

对希望打造RAG应用的企业,百炼支持Assistant API开发模式,可在百炼上轻松创建知识库,并一键开启知识检索增强(RAG),通过Assistant API联合输出。同时,百炼支持agent智能体开发,并能实现多智能体协作、对话记忆等高级功能。

据介绍,阿里云百炼的一大重要优势,在于最大程度的开放性和自由度。当下一些大模型应用平台采用封闭链路,不支持替换原子能力,导致企业开发应用时无法引入自研插件,和业务场景充分融合。

官方提供

百炼率先兼容并优化了LlamaIndex等开源架构,拥抱社区生态,支持从本地或不同云端导入SQL、pdf、excel、ppt等各种类型数据源,还支持根据需求自由替换精细的能力组件,让AI应用丝滑嵌入企业原有业务系统。

周靖人表示,接下来,百炼将继续做对开发者最友好、最开放的大模型平台。阿里云欢迎更多大模型上架,百炼将进一步支持三方模型的微调训练和云上专属部署,帮助大模型生态中的企业提供商业化服务。

开源开放,打造最受中国企业欢迎的大模型

通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

5月9日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

官方提供

此前,通义大模型还曾“上天入地”服务客户,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。

相关内容

热门资讯

仙乐健康:与记忆张量开启AI配... 中证报中证网讯(王珞)7月28日,在2025世界人工智能大会上,仙乐健康(300791)宣布与记忆张...
宁德邦源能源申请模具降温装置专... 金融界2025年7月29日消息,国家知识产权局信息显示,宁德邦源能源科技有限公司申请一项名为“一种嵌...
华为擎云 L540x:安全高能... 在复杂国际形势与关键领域自主创新加速的双重浪潮下,政企用户对终端设备的要求已从“可用”升级为“高效、...
美格智能跌0.50%,成交额2... 来源:新浪证券-红岸工作室 7月29日,美格智能跌0.50%,成交额2.31亿元,换手率2.82%,...
AI赋能人大|代表履职焕发新活... 近日,青秀区人大组织城区人大机关各委室负责人、镇(街道)人大和部分站点负责人在南湖街道开展以“汇聚人...
人形机器人,正撕掉“表演”标签 2025世界人工智能大会上的机器人们,已完成从“表演艺术”到“实用技能”的质变。 “中国具身智能企业...
WAIC 2025 启示录:安... 21世纪经济报道记者 王俊 实习生 张欣奕 2025世界人工智能大会(WAIC)刚刚落幕,作为业内的...
为机器人“上妆”吸引百万粉丝!... 10余位诺贝尔奖、图灵奖等国际顶尖奖项得主,80余位国内外知名院士,齐聚7月26日-28日2025世...
神州数码:旗下品牌发布基于鲲鹏... 2025世界人工智能大会(WAIC)期间,神州数码旗下神州鲲泰正式发布两款年度新品,分别是业界首款基...
20位AI领导者的年度洞察|W... 来源:第一财经日报 机器人开始成为今年世界人工智能大会(WAIC2025)的主角,这是WAIC自20...
上海Robotaxi大跨步:允... 文 | 赛博汽车 上海无人驾驶出租车(Robotaxi)跨出了一大步。 7月26日,在2025世界...
REDMI Pad2再剧透,1... 上周,REDMI红米手机官方宣布,REDMI Pad 2 新品来袭,将于8月1日正式开售。 官方介绍...
原创 性... 现代人最焦虑的瞬间莫过于:电量低于20%却找不到充电宝,或是手滑摔手机时听到那声清脆的“啪”。华为畅...
SpaceX发布新型“星舰”图... 【环球网报道】据美国《新闻周刊》29日报道,美国太空探索技术公司(SpaceX)近日发布新型“星舰”...
理想汽车申请驱测试的方法及装置... 金融界2025年7月29日消息,国家知识产权局信息显示,上海理想汽车科技有限公司申请一项名为“驱测试...
2025“高配低价”的3台手机... 现在手机市场基本上早已到达了一个疯狂内卷的现实,想要少花钱买一台还不错的手机“我只能说难上加难”,毕...
机构:脑机接口下游应用市场潜力... 来源:国海金贝壳 北京未来科学城管理委员会制定《昌平区“ 人工智能 +医药健康”产业发展实施方案(2...
第一次做硬件,阿里先稳一手 来源:源媒汇 文源:源Byte 作者:柯基的柯 “百镜大战”迎来了一位新玩家。 7月26日,202...
信测标准跌2.06%,成交额2... 来源:新浪证券-红岸工作室 7月29日,信测标准跌2.06%,成交额2.43亿元,换手率6.78%,...
嘉泰工程取得用于化工机械的环境... 金融界2025年7月29日消息,国家知识产权局信息显示,嘉泰工程技术有限公司取得一项名为“一种用于化...