RAG全景图:从启蒙到高级36技,至终章Agentic RAG -- 知识铺
检索增强生成(Retrieval-Augmented Generation, RAG)技术,最早由Facebook在2020年的一篇论文中提出,旨在通过结合信息检索和生成模型的技术,引入外部知识库信息,以提升处理知识密集型NLP任务(如问答系统、文本摘要等)的效果。大型语言模型(LLMs)虽展现出强大的能力,但在特定领域或知识密集型任务中仍面临挑战,包括产生幻觉、知识过时以及推理过程的不透明性和不可追溯性。RAG技术提供了一种有前景的解决方案,它通过整合来自外部数据库的知识,增强了生成的准确性和可信度,并允许持续的知识更新及特定领域信息的整合。RAG技术的核心可以分为两个主要阶段:首先,在检索阶段,模型从外部知识库中检索与输入文本相关的信息;其次,在生成阶段,将检索到的信息作为输入,利用一个生成模型(例如Llama3),基于这些信息生成最终的响应或文本。
高级RAG之36技
在企业级应用中,大模型RAG(Retrieval-Augmented Generation)的落地涉及多个技术要点。本文从架构、模块、技术三个维度,详细解析了RAG的全过程技术要点,包括一个框架、10个核心模块、以及36种关键技术。以下是对这些模块和技术的系统性总结:
1. Query理解(Query NLU)
-
技术概览:利用大型语言模型(LLM)重构用户Query,提升检索质量。
-
技术细节:包括意图识别、消歧、分解、抽象等。
-
技术数量:共7种技术。
2. Query路由(Query Routing)
-
技术概览:LLM支持的决策步骤,决定下一步行动。
-
技术细节:决策过程的优化。
-
技术数量:共1种技术。
3. 索引(Indexing)
-
技术概览:RAG的核心模块,涉及文档处理和索引构建。
-
技术细节:包括文档解析、文档切块、嵌入模型、索引类型等。
-
技术数量:共8种技术。
4. Query检索(Query Retrieval)
-
技术概览:除了向量检索,还包括图谱与关系数据库检索。
-
技术细节:图谱与关系数据库的检索技术。
-
技术数量:共3种技术。
5. 重排(Rerank)
-
技术概览:对不同检索策略的结果进行重排对齐。
-
技术细节:包括重排器类型、自训练领域重排器等。
-
技术数量:共3种技术。
6. 生成(Generation)
-
技术概览:解决生成过程中的重复、幻觉、通顺性等问题。
-
技术细节:包括RLHF、偏好打分器、溯源SFT、Self-RAG等。
-
技术数量:共7种技术。
7. 评估与框架
-
技术概览:RAG的全链路评价体系,用于上线与迭代。
-
技术细节:评价体系的构建与优化。
-
技术数量:共3种技术。
8. RAG新技术
-
技术概览:探讨RAG的未来发展方向及实现方法。
-
技术细节:未来技术的预测与规划。
-
技术数量:共3种技术。
全景框架图
- 描述:一张全景框架图,梳理了10个模块,36种技术(原版图,可编辑)。
终章之Agentic RAG
- 描述:大模型RAG问答的终章,指向Agentic RAG的发展方向。
|
|
例如,Query:“与第五交响曲创作于同一世纪的交通工具是什么?”,Agent分两个子问题来解决:
- 第一个子问题:“第五交响曲是在哪个世纪创作的?”
- 第二个子问题:“19世纪发明的交通工具”
RAG全景图专栏学习方式
PaperAgent团队打造的RAG全景图专栏囊括70+张图,总计5万余字,专栏之配套包括专业技术交流群、RAG流程与架构图原稿(可自由编辑)等等,专栏之详情咨询:【留言区或私信】 ,备注:RAG专栏
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/geek001/post/20240828/RAG%E5%85%A8%E6%99%AF%E5%9B%BE%E4%BB%8E%E5%90%AF%E8%92%99%E5%88%B0%E9%AB%98%E7%BA%A736%E6%8A%80%E8%87%B3%E7%BB%88%E7%AB%A0Agentic-RAG--%E7%9F%A5%E8%AF%86%E9%93%BA/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com