检索增强生成(RAG)为何在今天如此流行?
创始人
2025-07-11 10:20:53
0

人工智能领域,有一种名为检索增强生成(RAG)的方法正在成为帮助模型获得精准结果的关键途径。

你可以说这就像巧克力和花生酱一样——两种美味的食物搭配在一起会更加美味。

或者你也可以用更技术性的方式来描述它。本质上,检索增强生成是指在大语言模型应用其自身训练数据和知识来完成任务时,为其添加应该了解的额外信息。

GeeksforGeeks的专家是这样解释的:

"在传统的大语言模型中,模型仅基于其训练数据生成回复,这些数据可能不包含最新信息或特定任务所需的具体细节。RAG通过整合检索机制来解决这一局限性,允许模型实时访问外部数据库或文档。"

然后他们提供了一个包含"数据块"和其他组件的流程图,展示了这种方法的工作原理。

考虑一下这在实践中是如何工作的——例如,你可以给聊天机器人提供一系列关于你业务的白皮书,然后询问有关你商业模式的问题。或者在个人层面,如果你希望AI更好地理解你,你可以向它提供个人文档,如日记记录或你过去的文章,以帮助它更好地了解你这个人。

从广义上说,你可以认为RAG涉及添加任何不在原始训练集中的内容。这可能是出于细节、时效性或用途的考虑,或者仅仅是为了帮助按你希望的方式定向结果。

直击要点

我很喜欢这个观点——

在Learn By Building AI网站上,比尔·钱伯斯(Bill Chambers)解释说RAG有一种简单的方法。

首先,他将其与他在Facebook发现的这段描述进行对比:

"构建一个能够研究和情境化的模型更具挑战性,但这对未来的进步至关重要。我们最近在检索增强生成(RAG)架构方面取得了重大进展,这是一个端到端可微分模型,结合了信息检索组件(Facebook AI的密集段落检索系统)和序列到序列生成器(我们的双向自回归Transformer[BART]模型)。RAG可以在知识密集型下游任务上进行微调,与最大的预训练序列到序列语言模型相比,能够达到最先进的结果。与这些预训练模型不同,RAG的内部知识可以轻松更改甚至即时补充,使研究人员和工程师能够控制RAG知道什么、不知道什么,而无需浪费时间或计算能力重新训练整个模型。"

天哪...

然后钱伯斯提供了一个简洁的小图,显示"文档语料库"通过用户输入连接到大语言模型。

这对我来说很有意义:RAG意味着添加特定的信息资源!当然,有技术细节,但我认为这个教程在分解这个概念方面做得很好,所以这是任何想要了解更多关于它实际工作原理的人的另一个资源。

使用RAG

我还想参考微软AI项目高级总监索达拉拉詹·斯里尼瓦桑(Soundararajan Srinivasan)和他的同事、微软高级应用科学家瑞什米·戈什(Reshmi Ghosh)在四月份"想象付诸行动"活动上的技术演讲,他们讨论了RAG的实际应用。

使用"知识存储"、"向量数据库"、"编排器"和"元提示"等术语,斯里尼瓦桑介绍了这些系统如何工作,说它们帮助我们在上下文中理解AI的局限性。

"上下文"也是一个重要术语,因为正如他所描述的,更大的上下文窗口增加了能力,可能具有更低的内存占用。

演讲者谈到使用RAG的其他一些原因包括:

结合知识和推理

民主化模型使用

提高时间资源效率

戈什随后谈到了我们如何理解模型是否选择在其处理中使用RAG信息。

"你有所有这些不同的上下文与查询一起发送,告诉模型'嘿,这是你可能知道也可能不知道的外部知识',"她说。

"当我们使用大语言模型以及像llama和phi这样的小语言模型设计系统时,我们基本上发现,如果你可以通过分割数据点而不是微调来发送上下文,你仍然会以准确的定性方式获得事实查询的答案。"

戈什还提到了多模态性。

"你基本上可以拥有包含图像、语音笔记、声音或任何类型音乐笔记的数据库,你仍然可以围绕它构建AI应用程序并获得同样的收益,因为现在你知道模型倾向于利用RAG上下文并减少对内部记忆的依赖,这也为正在讨论的所有新框架打开了新的大门。"

她补充说,这对于MCP(模型上下文协议)和A2A(智能体到智能体系统)等协议很有用。

相关内容

热门资讯

太原科大技术斩获日内瓦发明展金... 本报讯(记者沈佳)在近日举行的第50届日内瓦国际发明展上,太原科技大学牵头研发的“大型宽厚钢板液压滚...
微信的“祖师爷”Skype、百... 作者 | 吴梅梅 来源|IT桔子 封面|公众号AI生成 2025 年上半年,我们见证了多家曾熠熠生辉...
再创多个“首次”“之最”,我国... IT之家 7 月 10 日消息,据央视新闻报道,经过多年研究攻关,中国科学院脑科学与智能技术卓越创新...
信利光电取得一种塑胶中框专利,... 金融界2025年7月11日消息,国家知识产权局信息显示,信利光电股份有限公司取得一项名为“一种塑胶中...
迈拓仪表取得超声水表用换能器塑... 金融界2025年7月11日消息,国家知识产权局信息显示,迈拓仪表股份有限公司取得一项名为“一种超声水...
“三星Galaxy Z Fol... 今天,“三星Galaxy Z Fold7真机曝光”冲上百度热搜。 昨日晚间,三星电子正式发布新一代...
总投资5.2亿元!商丘市夏邑县... 立方招采通显示,7月9日,夏邑县5G网络资源建设项目公开招标,总投资5.2亿元,投标截止时间为202...
湖北卫视力荐AI新品:TOUT... 近日消息,湖北卫视将通过抖音官方账号【湖北卫视好物甄选】、全新节目《AI 热搜榜》《AI 相对论》,...
极氪9X技术发布:中国豪华SU... 潮新闻客户端 记者 赵瑛 7月9日晚,一场技术发布会,5颗激光雷达,双Thor-U芯片,900V高压...
浩利丰取得一体式紫铜消音器专利... 金融界2025年7月11日消息,国家知识产权局信息显示,武汉浩利丰机械有限公司取得一项名为“一种一体...
人保再保发布行业首个《新能源汽... 2025年6月,在人保再保险股份有限公司第五届“技术引领,共创未来”技术论坛上,公司正式发布了行业首...
SpaceX第七次载人飞行Cr... 2025-07-11 09:20:55 作者:狼叫兽 NASA 与 SpaceX 近日正式宣布,...
我科研团队首次实现小鼠全身神经... 来源:科技日报 科技日报记者 吴长锋 记者10日从中国科学技术大学获悉,该校毕国强教授、刘北明教授联...
从“实验室”走向“生产线” 全... 封面新闻记者 伍雪梅(主办方供图) 7月10日,“长江首城宜创汇”协同创新大赛人工智能专项赛总决赛在...
正海磁材:人形机器人等领域有望... 今年以来,随着机器人行业的快速发展,作为上游原材料的稀土永磁行业也备受市场关注。 日前,正海磁材(3...
原创 百... 2024年,我选定一个题材,用100台国产老相机拍摄100个胶卷。然后把相机送给有缘人(也就是进入我...
淄博:三大赛道支撑装备制造业突... 回首过往,淄博制造的金字招牌熠熠生辉,在深厚工业底蕴的滋养下,淄博装备制造业这个已有百年底蕴的产业,...
航宇科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示航宇科技(688239)新获得一项实用新型专利授权,专利名为“...
真相来了|网传太阳能板释放有害... 央视网消息:国家统计局数据显示,2024年,我国太阳能电池产量达6.8亿千瓦,同比增长15.7%。日...
消息称黄仁勋下周到访中国:特供... 来源:快科技 快科技7月11日消息,H20被禁止向中国厂商禁售后,黄仁勋可能是最着急的人,不过现在看...