阿里开源“零搜索”技术,训练成本直降88%,准确度超谷歌搜索
创始人
2025-05-11 09:21:23
0

智东西

编译 | 金碧辉

编辑 | 程茜

智东西5月9日消息,阿里巴巴5月7日发表于arXiv的论文透露,阿里巴巴达摩院研发的“零搜索”(ZeroSearch)技术突破性破解AI训练成本困境。该技术能通过模拟搜索引擎训练机制,使大模型在无需调用真实搜索引擎API的情况下自主进化检索能力。

▲阿里巴巴达摩院研究团队发表于arXiv的论文原文

“零搜索”技术打破依赖科技巨头的API经济模式,开发者可精准控制训练数据质量。目前开源代码已登陆GitHub和Hugging Face平台,涵盖Qwen-2.5、LLaMA-3.2等主流架构,支持基础版和指令微调版模型。初创企业可用四块A100显卡搭建高精度训练环境。

在包含NQ、TriviaQA、PopQA、HotpotQA等七大主流问答数据集的综合测评中,基于“零搜索”技术训练的140亿参数大模型不仅搜索准确率力压谷歌,更实现训练成本直降近九成。

▲arXiv论文原文中的七大主流问答数据集的综合测评图表

据VentureBeat今天报道,原本需要调用商业搜索引擎API的586.70美元(折合人民币约为4240.74元)开销,如今仅需70.80美元(折合人民币约为510.17元)即可完成同等量级训练任务。这项创新让AI模型在“自我模拟”(self-simulated)中获得出类似搜索搜索引擎的检索能力。

一、 “零搜索” 技术成本大降超八成,性能超越谷歌搜索

研究人员使用SerpAPI调用谷歌搜索服务作为对照组,通过模拟传统AI训练流程中调用商业搜索引擎API的场景,与“零搜索”技术方案进行成本对比。

研究人员测算,使用SerpAPI调用谷歌搜索处理约6.4万次查询,成本约为586.70美元(约合人民币为4228.82元);而在四块A100 GPU上运行14B参数的大语言模型,仅需70.80美元(折合人民币约为510.43元),节省幅度高达88%。

据TechCrunch 2024年11月报道,从目前存在的一些公开信息透露,SerpAPI旨在帮助开发者绕过复杂的网页解析流程,SerpAPI能通过API调用获取谷歌、Bing、百度等主流搜索引擎的搜索结果数据。

SerpAPI的实际企业用户包括Jasper.ai、Copy.ai等AI初创公司,这些企业通过API接口获取实时搜索结果训练对话系统,但具体成本数据未被披露。

二、阿里大模型能生成拟真文档,较谷歌API节省88%开支

阿里巴巴的研究团队发现,经过海量预训练的大模型已具备拟真文档生成能力。通过监督微调将大语言模型转化为检索模块,能按需生成相关或无关文档组合。

在强化学习阶段,系统通过渐进式降低生成文档质量的“教学方案”,迫使模型持续优化检索精度,形成自主进化闭环。

据VentureBeat今天报道,在TriviaQA等7个主流问答数据集测试中,基于通义千问2.5、LLaMA3.2等架构的模在数学视觉推理测试中得分超过OpenAI o1,展现了强大的图形与数学结合的分析能力。14B参数模型在事实准确性指标上超越谷歌搜索2.3个百分点,7B模型与商业引擎持平。相同训练量下模拟方案较谷歌搜索API节省88%开支。

结语:“零搜索”技术推动AI产业进入低成本自主进化阶段

阿里巴巴达摩院的突破可能是AI训练范式的重要转折。当大模型能在封闭系统内模拟现实世界的信息交互,用户得以摆脱对外部服务的依赖,这对数据安全、训练可控性及技术民主化或具有深远意义。

从行业发展趋势来看,“零搜索”技术有望对AI开发价值链产生深远影响。随着自模拟技术成熟,未来,或将涌现更多AI训练方案,推动产业进入低成本自主进化的新阶段。

来源:arXiv、VentureBeat

相关内容

热门资讯

原创 还... 在中国数千年的历史长卷中,女性的社会地位曾长期处于相对弱势的状态。然而,随着时代的发展和思想的解放,...
中天科技等公布“腔体滤波器”专... 天眼查APP显示,近日,中天通信技术有限公司,中天宽带技术有限公司,江苏中天科技股份有限公司申请的“...
傲农生物获得发明专利授权:“配... 证券之星消息,根据天眼查APP数据显示傲农生物(603363)新获得一项发明专利授权,专利名为“配种...
原创 苹... 本来一些人以为,今年苹果的A19系列芯片,可能会使用台积电的2nm工艺。 但当iPhone17发布时...
距地40光年外TRAPPIST... 在浩瀚宇宙中,距离地球约40光年的深空里,一颗名为TRAPPIST-1e的类地行星正吸引着科学界的目...
数智驱动 金融服务场景上“新” 走进2025年中国国际服务贸易交易会(以下简称“服贸会”)金融服务专题,满满的科技感扑面而来。 金融...
亚玛顿公布“边框同步封装的轻质... 天眼查APP显示,近日,常州亚玛顿股份有限公司申请的“边框同步封装的轻质组件及其制备方法”专利公布。...
国内单体规模最大陆上风电项目正... 来源:央视新闻客户端 今天(14日),我国首批规模性采用10兆瓦发电机组的单体最大陆上风电项目——内...
看贴了防窥膜的手机快瞎了?它到... 一年一度 又到了上新的时刻 你预约到了没 拿到新手机的你会给它贴膜吗? 你是否也有过这样的担忧 ...
iPhone Air,弯了? 前几天的苹果发布会大家都看了吗? 讨论度最高的除了“iPhone 17标准版终于加上了高刷”,还有全...
当文物插上科技的翅膀,历史更加... ✨ 在福州市博物馆,观众在看展的同时,通过扫码、拍照、打卡等一系列动作支持文物的数字化保护;漳州市博...
能辉科技与蚂蚁数科达成合作共识... 上证报中国证券网讯(记者胡嘉树)在“2025 Inclusion外滩大会”期间,能辉科技与蚂蚁数科签...
国际能源署:低排放氢气项目面临... 新华社巴黎9月12日电(记者罗毓)国际能源署12日发布《2025年全球氢能评估》报告说,尽管面临多重...
福立旺获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示福立旺(688678)新获得一项实用新型专利授权,专利名为“一...
“孙子智慧”与“营商之道”对话... 转自:滨州发布 9月12日,“孙子智慧”与“营商之道”对话会在滨州市惠民县举行,海峡两岸孙子文化研究...
新机备货量预估40-60万台,... 昨日,华为于9月4日发布的第二款三折叠新机华为Mate XTs 非凡大师正式首销,根据官方公开信息显...
全球知名高校共建“文明实验室国... 本报讯 (记者 程晓琳 杨频萍) 9月13日,由南京大学发起的首届全球文明数智研究会议在南京举行,“...
原创 给... 当世界还沉浸在硅谷打造的“科技神话”中,中国的一支青年科技力量,悄然打破了技术封锁的天花板。深度求索...
记者手记:在服贸会上感受“数智... 新华社北京9月13日电 记者手记:在服贸会上感受“数智”与“金融”双向奔赴 新华社记者于佳欣、任军、...
电厂 | 拼多多搭建舞台,为助... 作者 商迪安 提起东非,你会想到什么?是广袤无际的草原、壮观的野生动物迁徙,还是那道素有“地球伤疤”...