司南OpenCompass 2.0评测GLM-4稳坐国内榜首,智谱AI大模型实力强悍
创始人
2024-05-22 15:40:39
0

近期,大模型开源开放评测体系司南(OpenCompass 2.0)公布了2024年4月大语言模型最新评测榜单,智谱AI的GLM-4继续保持国产大模型第一的领先身位。

大模型开源开放评测体系司南(OpenCompass 2.0)由上海人工智能实验室发布。其月度榜单从基础能力和综合能力的设计出发,构建了一套高质量的中英文双语评测基准体系,对主流开源模型和商业API模型进行了全面评测分析。评测榜单涉及的大语言模型和多模态大模型超过150个,更有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。

在4月客观评测榜单中,OpenCompass基于语言、知识、推理、数学、代码、智能体六个维度构建了15000余道高质量中英文双语问题,并引入OpenCompass团队首创的循环评估 (Circular Evalution) 策略,系统性分析了国内外大模型的客观性能。其中,GLM-4位列第四名,仅次于GPT-4-Turbo系列与Claude3-Opus,成为国内大模型客观评测月度总榜第一名。在语言维度方面,GLM-4分数达到57.7分表现突出,超过GPT-4-Turbo系列与Claude3-Opus。在知识维度上,GLM-4得到68.9分,超过第二名的GPT-4-Turbo-1106,与第三名Claude3-Opus不相上下。

值得一提的是,GLM-4此前便长期占据OpenCompass 2.0榜单前列,并多次在权威榜单与全球顶级大模型一较高下。清华《SuperBench大模型综合能力评测报告》显示,GLM-4在语义理解等方面的能力表现超过了GPT-4-Turbo等国际一流模型,在代码、智能体等方面,排名国内第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准中,GLM-4斩获一项A+及多项A级评价,在国内大模型中排名第一。

据了解,GLM-4是由智谱AI于今年1月推出的新一代基座大模型。GLM-4整体性能逼近GPT-4,它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。依托GLM-4 All Tools能力,GLM-4智能体能够实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

开发者可以通过智谱AI大模型开放平台bigmodel.cn接入GLM-4模型开放API,便捷高效地体验GLM-4的强大能力。

相关内容

热门资讯

科创板公司透露:华为来调研了 专家组重点考察了公司工业软件的最新研发成果以及在高端智能装备、智能制造的创新应用情况,双方就突破工业...
8年未删的游戏图标,藏着我整段... 我每次打开电脑的时候,都会习惯性瞥一眼桌面右上角的游戏图标。 虽然没有经常打开,有时候甚至半年都没上...
无人机、卫星通信车抢修,密云、... 7月27日在密云区、28日在怀柔区,一架无人机缓缓升空。这是北京移动启动无人机基站用于应急通信的缩影...
蛋白质设施2.0版将打造生命科... 蛋白质设施2.0版将打造生命科学“数据生产力平台” 十年前,上海张江,全球首个生命科学领域综合性大科...
理想无人驾驶真的来了! 三天前,我们体验了理想的“穿梭巴士”,真的让人叹为观止! 一起来看看它都能做什么? 首先,他可以接受...
微软正就继续使用OpenAI技... 来源:环球市场播报 彭博新闻周二援引两位知情人士的消息报道,微软正就一项协议进行深入谈判,该协议将使...
篝火旁食物为何更美味 一兵 为什么篝火旁的食物更美味?据美国《大众科学》期刊报道,其答案与食物本身关联不大,但与围绕它的...
机器人习得“十八般武艺”后,还... 来源:IT时报 作者/ IT时报记者 沈毅斌 编辑/ 钱立富 孙妍 去年世界人工智能大会上,“十八金...
福建佳龙智能科技取得米包装箱机... 金融界 2025 年 7 月 29 日消息,国家知识产权局信息显示,福建佳龙智能科技有限公司取得一项...
仙乐健康:与记忆张量开启AI配... 中证报中证网讯(王珞)7月28日,在2025世界人工智能大会上,仙乐健康(300791)宣布与记忆张...
宁德邦源能源申请模具降温装置专... 金融界2025年7月29日消息,国家知识产权局信息显示,宁德邦源能源科技有限公司申请一项名为“一种嵌...
华为擎云 L540x:安全高能... 在复杂国际形势与关键领域自主创新加速的双重浪潮下,政企用户对终端设备的要求已从“可用”升级为“高效、...
美格智能跌0.50%,成交额2... 来源:新浪证券-红岸工作室 7月29日,美格智能跌0.50%,成交额2.31亿元,换手率2.82%,...
AI赋能人大|代表履职焕发新活... 近日,青秀区人大组织城区人大机关各委室负责人、镇(街道)人大和部分站点负责人在南湖街道开展以“汇聚人...
人形机器人,正撕掉“表演”标签 2025世界人工智能大会上的机器人们,已完成从“表演艺术”到“实用技能”的质变。 “中国具身智能企业...
WAIC 2025 启示录:安... 21世纪经济报道记者 王俊 实习生 张欣奕 2025世界人工智能大会(WAIC)刚刚落幕,作为业内的...
为机器人“上妆”吸引百万粉丝!... 10余位诺贝尔奖、图灵奖等国际顶尖奖项得主,80余位国内外知名院士,齐聚7月26日-28日2025世...
神州数码:旗下品牌发布基于鲲鹏... 2025世界人工智能大会(WAIC)期间,神州数码旗下神州鲲泰正式发布两款年度新品,分别是业界首款基...
20位AI领导者的年度洞察|W... 来源:第一财经日报 机器人开始成为今年世界人工智能大会(WAIC2025)的主角,这是WAIC自20...
上海Robotaxi大跨步:允... 文 | 赛博汽车 上海无人驾驶出租车(Robotaxi)跨出了一大步。 7月26日,在2025世界...