合合信息Embedding模型获C-MTEB榜单第一
创始人
2024-03-29 22:39:21
0

原标题:合合信息Embedding模型获C-MTEB榜单第一

中证网讯(王珞)近期,合合信息发布了文本向量化模型acge_text_embedding(简称“acge模型”),获得MTEB中文榜单(C-MTEB)第一的成绩。相关成果将有助于大模型更快速地在千行百业中产生应用价值。

据了解,MTEB(Massive Text Embedding Benchmark)是衡量文本嵌入模型(Embedding模型)的评估指标的合集,是目前业内评测文本向量模型性能的重要参考。对应的C-MTEB则是专门针对中文文本向量的评测基准,被公认为是目前业界最全面、最权威的中文语义向量评测基准之一,为深度测试中文语义向量的全面性和可靠性提供了可靠的实验平台。阿里、腾讯、商汤、百川等多家厂商在此榜单测评发布模型。

Embedding模型能够将单词、句子或图像特征等高维的离散数据转换为低维的连续向量,捕捉到数据的语义特征和关系,被广泛应用于搜索、推荐、问答、检索增强生成、数据挖掘等领域。互联网时代中,随着信息量急剧膨胀,人们接触信息的渠道不断拓展,大量无关的信息已成为信息检索的干扰项,Embedding模型能够显著提高信息搜索和问答的质量、效率和准确性,让搜索和问答引擎不再只是匹配文字,而是可以真正理解人的意图。

公司团队成员表示,以自制一杯咖啡举例,借助Embedding模型,引擎能更准确地理解用户意图,从而提供包括但不限于咖啡机选择、咖啡豆磨豆技巧、不同的冲泡方法等更实用的指南。

为了更好地发挥大模型在应用过程中的价值,合合信息技术团队打造了acge模型。与目前C-MTEB榜单上排名前五的开源模型相比,合合信息发布的acge模型较小,占用资源少,且模型输入文本长度为1024,满足绝大部分场景的需求。此外,acge模型还支持可变输出维度,让企业能够根据具体场景去合理分配资源。

据团队成员介绍,相比于传统的预训练或微调垂直领域模型,acge模型支持在不同场景下构建通用分类模型、提升长文档信息抽取精度,且应用成本相对较低,可帮助大模型在多个行业中快速创造价值,为构建新质生产力提供强有力的技术支持。

合合信息是一家人工智能及大数据科技企业,基于自主研发的领先的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。公开资料显示,公司的C端产品覆盖了全球百余个国家和地区的亿级用户,B端服务覆盖了近30个行业的企业客户。《财富》杂志2022年发布的世界500强公司名单中,公司客户已覆盖超过125家。

相关内容

热门资讯

嘉兴速迪取得用于分散剂生产的干... 金融界2025年7月5日消息,国家知识产权局信息显示,嘉兴速迪高分子材料有限公司取得一项名为“一种用...
网易申请模型训练及图像评估相关... 金融界2025年7月5日消息,国家知识产权局信息显示,网易(上海)网络有限公司申请一项名为“模型训练...
安卓系统智能应用启用Mater... 2025-07-05 11:21:19 作者:狼叫兽 7月5日消息,据科技媒体报道,谷歌在安卓系...
“700xxxxxxxxxxx... “700xxxxxxxxxxxx”电话号码要来了! 为什么要开设 “700开头”的15位电话号码? ...
TikTok生态盛会:洛杉矶线... 6月11日,一场备受瞩目的盛会——“2025美国短视频线下达人选品展览会·洛杉矶站”在洛杉矶会展中心...
上海交大团队突破 AI 设计热... IT之家 7 月 6 日消息,上海交通大学领导的一支国际科研团队,在基于 AI 的超宽波段及波段选择...
联防联控 应急排涝!市城管局全... 7月5日,汕头台风预警信号升级为黄色,防风应急响应提升为III级。市城管局高度关注台风动态,及早部署...
雷军现身!小米YU7正式交付 7月6日下午,小米首款SUV YU7在58城同步开启交付,北京小米科技园举行首批车主交付仪式。小米集...
活动回顾 | 6月小手玩科学,... 当油滴在水中抱团时,是谁给了它们融合的勇气?彩色色素为何在透明液体里呈现出沉降的彩虹雨?当手柄按下时...
华为盘古团队回应AI模型抄袭争... DoNews7月6日消息,华为 6 月 30 日宣布开源盘古 7B 稠密和 72B 混合专家模型,但...
马丁特尼尔取得自动化的激光切割... 金融界2025年7月5日消息,国家知识产权局信息显示,深圳市马丁特尼尔技术有限公司取得一项名为“一种...
小米取得加湿器专利,提供一种柔... 金融界2025年7月5日消息,国家知识产权局信息显示,北京小米移动软件有限公司取得一项名为“加湿器”...
顶锋剃须刀取得剃须刀刀片安装组... 金融界2025年7月5日消息,国家知识产权局信息显示,泰州市顶锋剃须刀制造有限公司取得一项名为“一种...
心智观察所:独家对话|周露:生... 【对话/观察者网心智观察所】 在生命科学疆域疾驰的时代浪潮中,基因治疗正以前所未有的速度重塑着对抗...
北京6G实验室产业伙伴合作正式... 7月5日,2025全球数字经济大会“6G技术创新与产业发展峰会”在北京经济技术开发区(北京亦庄)通明...
华峰新材申请耐磨印花涂层布料及... 金融界2025年7月5日消息,国家知识产权局信息显示,福建华峰新材料有限公司申请一项名为“一种耐磨印...
告别合规“人海战术”,奇富科技... 记者 黄敏 6月20日,国家金融监督管理总局发布《商业银行市场风险管理办法》,银行业随即掀起了一场监...
Jacky Tsai:以波普艺... 今年5月,东风商业航天创新试验区的天际被一道烈焰划破。朱雀二号改进型遥二火箭带着“嫦娥奔月” 的斑斓...
厘清“刷脸”边界 筑牢人脸信息... 央视网消息(焦点访谈):人脸信息与人体的其他生物特征,如指纹、虹膜等与生俱来,具有唯一性。这些关键信...
前海梦工场很AI 20余家科创... 深圳新闻网2025年7月6日讯(深圳商报记者 范宏韬)7月4日,由前海深港青年梦工场主办、梦工场在园...