阿里云发布开源模型Qwen2,称超百度文心4.0等众多中国厂商闭源大模型
创始人
2024-06-07 21:01:36
0

图片来源:视觉中国

开源大模型在AI竞赛中再扳回一城。

6月7日,阿里云发布开源模型Qwen2-72B。根据官方宣称,Qwen2不仅超过此前Meta推出的开源模型Llama3-70B,也超过了百度文心4.0、字节豆包pro、腾讯混元pro等众多中国厂商的闭源大模型。

据阿里云介绍,本次开源的Qwen2-72B大模型在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的开源模型,包括阿里云在4月底开源的Qwen1.5最大的模型Qwen1.5-110B。

图片来源:阿里云

阿里云通义千问团队披露称,Qwen2实现了整体性能的代际飞跃。该系列包含5个尺寸的预训练和指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。所有尺寸模型都使用了GQA(分组查询注意力)机制,以便让用户体验到其带来的推理加速和显存占用降低的优势。此外,模型的多语言能力和上下文长度支持均得到了提升。

目前所有用户都可以在阿里旗下的AI模型社区魔搭社区和开源平台Hugging Face上免费下载开源模型Qwen2-72B。

在Qwen2发布后,Hugging Face联合创始人兼首席执行官Clement Delangue也很快在社交平台X上发帖表示,其开源大模型榜单迎来了新的第一。

许多国外的开发者也纷纷表示欢迎,“这个开源大模型就如同今天SpaceX成功发射的星舰一样重要!”一位网友评论称。

通义千问Qwen系列开源模型正在成为Meta的Llama系列大模型之外的另一选项,在国外开发者社区中也获得了较高的讨论度。据官方信息,通义千问Qwen系列模型在近一个月内的总下载量翻了一倍,已突破1600万次,全球开源社区出现了超过1500款基于Qwen二次开发的模型。

如果Meta是国外开源阵营的执旗者,那么国内则站着阿里云、腾讯等国内大厂以及百川智能、智谱AI等初创企业。

他们认为开源能够降低使用门槛,带动大模型生态的繁荣,大多采取的是开源和闭源模型并行的策略。阿里云此前除了开源1100亿参数的Qwen1.5-110B模型,还同时发布了闭源大模型通义千问2.5。

而大模型闭源的拥趸则认为,为了保持领先,选择闭源的企业会投入大量的成本在模型的质量和安全上,并祭出了一个强大的例子——采取完全闭源的OpenAI。

百度CEO李彦宏曾多次表示,大模型开源意义不大,闭源模型在能力上会持续地领先,而不是一时地领先,“开源模型会越来越落后”。

在这番发言后不久,Meta就推出了当时能力最强的开源模型Llama 3,具备8B和70B两个版本。

阿里云CTO周靖人在回应开闭源之争时曾指出,“Llama 3把竞争的水位拉得很高。坦诚地说,不是所有闭源公司的模型都能比得上开源模型,至少闭源模型要能超过开源模型水准,才有机会参与这样的讨论。”

在发布本次开源模型时,周靖人再次强调,坚持开源开放是阿里云的重要策略,阿里云希望让算力更普惠、让AI更普及。

除了这些上价值的口号之外,把先进的大模型开源对阿里云来说也有很多现实意义。

一方面,作为头部云厂商,阿里云具备充足的算力、通信网络等AI基础设施,能够支持开源大模型的研发和训练。另一方面,在“AI驱动、公共云优先”的策略下,阿里云希望通过开源模型吸引更多的企业和开发者,使用其供应的基础设施,带动其云计算业务的增长。

阿里巴巴集团董事长蔡崇信5月31日在上海举办的摩根大通中国峰会中谈及,“在业界,阿里巴巴可能是极少数同时拥有强大人工智能业务和领先云计算业务的公司之一。”他指出,人工智能与云计算的紧密结合至关重要。当用户在社区内使用开源人工智能工具时,他们自然需要计算资源,这也是阿里云计算收入得以增长的重要推动力。

因此,阿里云有足够的动力积极推动其开源模型为开发者所接受,以便加快其云计算业务的销售。

据阿里2024财年Q4及全年业绩,阿里云季度收入增长3%至255.95亿元,核心公共云产品收入实现两位数增长,AI相关云产品实现三位数增长。在业绩会上,管理层预计云业务下半年将恢复至两位数增长,主要受AI新产品的驱动。

相关内容

热门资讯

百镜出道,C位依旧:WAIC顶... 来源:雷科技 如果说 WAIC 2025 是今年 AI 硬件的「集体高考」,那 Rokid Glas...
韩媒:韩国扶持五大联合体开发“... 综合韩联社、《朝鲜日报》和《京乡新闻》等韩媒报道,韩国政府4日正式选定NAVER Cloud、Ups...
录取通知书的“飞驰”之路 7月盛夏,安徽省近50万封承载着无数学子青春梦想与家庭期盼的高考录取通知书,正从四面八方“飞驰”向它...
凡知智造取得恒温核酸扩增分析仪... 金融界2025年8月6日消息,国家知识产权局信息显示,山东凡知智造医药科技有限公司取得一项名为“一种...
原创 离... [撒花] 随着科技的不断发展,“仿人形机器人”也变的越来越成熟了,AI的加持也让这些机器人变的更加智...
当AI化身“全能助手”,人类的... 正在屏幕前玩手机的你 有没有过这样的体验? 遇到不懂的问题 第一反应不是翻书思考 而是脱口而出“嘿 ...
珠海创信电子取得电路板用锡膏检... 金融界2025年8月6日消息,国家知识产权局信息显示,珠海创信电子有限公司取得一项名为“一种电路板用...
NBN Co转投亚马逊柯伊伯计... 来源:C114通信网 C114讯 北京时间8月6日晚间消息(蒋均牧)NBN Co与亚马逊达成协议,通...
石景山这家医院药品有了“电子身... “窗口不用一盒盒扫码吗?取药几乎不用排队,这速度真给力!”在北京大学首钢医院门诊药房,刚取到药的患者...
电力数据“会说话” 点亮智慧新... 本文转自【新华社】 新华社北京8月6日电 《经济参考报》8月6日刊发记者邓林如采写的文章《电力数据“...
国能新疆红沙泉二号矿实现纯电无... 近日,在国家能源集团新疆红沙泉二号露天煤矿(以下简称“红二矿”),58台无人驾驶矿卡正高效运转,其中...
普天科技:致力数据治理领域打造... 金融界8月6日消息,有投资者在互动平台向普天科技提问:公司相关产品或技术有哪些能为人工智能赋能?谢谢...
DeepMind发布Genie... 来源:至顶网 尽管目前还没有人找到通过生成式人工智能赚钱的可靠方法,但这并没有阻止Google D...
【喜讯】骨三科陈美玲在全国竞赛... 8月2日,在全国首届护理AI创新应用技能挑战赛决赛中,我院骨三科陈美玲的作品《创新聚力赋能发展——A...
微信内存一下就少了10G上热搜... 站长之家(ChinaZ.com)8月6日 消息:今日,微博热搜榜上#微信内存一下子就少了10G#的话...
我是宁波技能冠军④丨这些技能高... 前言 从工业设备控制(PLC)、工业机器人系统操作等“硬核”制造能力,到人工智能训练、网络安全等高科...
聚焦人工智能产业链 山东蓄力打... 中新网济南8月6日电 (记者 沙见龙)“这项体系如同人工智能产业的‘中央厨房’,能根据不同行业的差异...
2025未来科学大奖揭晓,他们... 科学之光照亮人类未来。6日,备受关注的2025未来科学大奖揭晓。这个夏天,“高冷”的基础研究再次变得...
为什么CA需要有《电子认证服务... 来源:SSL_SecureSocketLayer 1. CA是什么?—— 数字世界的「信任基石」 C...
2025 年 2 款华为会议记... 现在远程会议越来越多,不管是企业还是个人,都需要能快速整理会议记录的工具。我作为科技产品体验师,选了...