解密prompt系列44.RAG探索模式？深度思考模式？-6ren

解密prompt系列44.RAG探索模式？深度思考模式？

转载作者：撒哈拉更新时间：2024-12-14 10:47:42

56

4

前一阵多步RAG的风吹入了工业界，kimi推出了探索版本，各应用都推出了深度搜索，You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的实现。之前学术界在讨论multi-hop RAG的时候总是给一些基于历史知识类的问题，什么某年诺贝尔奖的获奖人在哪读的大学呀，给人一种错觉就是这类问题现实世界里真的有人这么提问么？其实还真有！。

这里举几个单步RAG效果可能不好的case，在碰到的很多场景里，多步RAG其实主要针对模糊指代的问题，包括。

偏动态信息的主体指代：例如事件，产品，政策，现象

华为最新型号的手机市场怎么看：需要先获取华为最新的手机型号
最新出台的房地产政策专家解读：需要先获取最新的房地产政策
请根据当前的市场成交情况，分析当前市场情绪：需要获取当前市场成交数据

偏静态知识的主体指代：例如分类，话题，主题，相关主体

近三年全国各大电影节的获奖名单：需要先获取有哪些电影节，再逐个获取每个电影节的获奖名单
光伏上下游产业链近期有哪些利好政策：需要先获取光伏上下游产业链节点

抽象指代：需要先验知识，专家经验，对前置问题的回答

请依据美林时钟，判断从2013年到2023年间都经历哪些经济周期阶段：需要先获获取美林时钟的定义
探讨我国粮食价格的形成机制，从市场供求关系、政策调控等多个因素分析价格变动的原因：需要先搜索粮食价格形成机制

多条件指代：因为条件过于复杂，需要多步缩小筛选范围

哪些国家在内部制造业不景气的时候，通过设立贸易壁垒来解决失业率过高的问题
哪些中央银行，曾经因为长时间通货膨胀居高不下，在经济不景气的时候还不得不提高提率水平

时间指代

贵州茅台最新季报的资产负债情况：需要先获取当前时间，定位季报
近一周异动板块有哪些：需要获取当前时间，并定位时间窗口

前面说单步RAG可能解决不好，因为以上的场景当你幸运的召回了正确的数据时，包括但不限于query改写拆解引入相关信息，检索部分解决了时效性问题，模型自身压缩知识的辅助等等，其实是有可能解决的，当然需要碰运气哈哈哈~~ 。

例如华为手机刚发布大热，那你不需要获取华为最新的手机号，直接使用搜索引擎搜索“华为最新型号的手机市场怎么看”,这时搜索引擎已经帮你处理了热点的时效性问题，大概率你就能获得正确的答案.

再比如"光伏上下游产业链近期有哪些利好政策"，可能把query拆解为光伏上游产业链利好政策+光伏中游产业链利好政策+光伏下游产业链利好政策，你不需要知道上中下游具体是啥，也是能检索到部分有效信息的.

但是！我们需要的是可以稳定解决复杂，多条件，模糊指代问题的方案！。

所以下面我们会给出多步RAG的几个核心步骤和对比，再讨论几篇论文大致的实现方案，论文细节大家感兴趣可以自己去看。更多RAG query改写，召回，粗排，精排的多个步骤我们在前面的章节已经说过，这里就不提了~ 。

方案对比

懒得看具体方案的小伙伴直接看对比吧，这里总结对比下多步RAG的几个核心模块，和几种实现方案。

模块	方案1	方案2	方案3	对比
规划模块/COT	每次只基于上一步的检索规划下一步的局部规划方案	全局预规划	先全局预规划再进行修订	局部规划方案容易歪楼，有时会缺少整体视角；全局规划是否需要修订其实部分取决于拆分步骤的方式，如果拆分过程不和query耦合其实多数场景不用修订也是可以的
子Query生成	和规划等同（规划本身就是子Q）	和规划一起全局生成	依赖前面的的检索结果生成（全部or上一步）	方案2和3结合的方式更常见，依赖检索结果的Query提供更加specific的检索视角，而只依赖主Q拆分的子Q提供更加general的检索视角
推理	每一步独立推理拼接最后润色	获得所有检索结果后一体生成	每一步基于上一步的推理和新获得的检索内容向后续写	连贯性最好幻觉较低，但对模型长文本有更高要求的肯定是一体化生成方案类似Kimi；You.COM的生成结果更类似于多步推理再拼接润色；而对于一些超长文本生成续写的方案使用更多

在尝试过You.COM的Genius模式，Kimi的探索模式，智谱的深度搜索后，发现除了以上的核心模块，多步RAG还有以下几个可以进一步提升效果的方向。

Reflection: 复杂问题往往很难一步到位，通过对推理结果进行反思，发现遗漏的方向，然后新增一步检索推理进行补充，或者对原始推理修订

针对多跳问题设计更适配的Query生成方案：复杂query往往涉及多条件，或者多主体，因此在Query拆解上需要有更多的视角。几种Query生成视角包括

相似改写：最常见的单步RAG主要使用
角度拆解：问题独立的多个视角（多步RAG的问题拆解是串行的这里是并行的），单步RAG主要使用，例如

抽象、系统思维：类似step-back prompt，通过对问题抽象，获取领域概念或先验知识，多步RAG的第一步query拆解常用，例如
简化假设：通过放宽问题假设来补充信息召回，多步RAG中多条件的复杂问题常用，例如

实体遍历: 通过对第一步检索得到的实体进行遍历生成第二步检索的query，通过明确主体获得更丰富的主体信息，多步RAG的第二步常见，例如
历史视角：分析影响类问题，事件解读类问题，多引入历史视角来补充观点

几种实现

局部 + 生成：IRCOT

Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions

https://github.com/StonyBrookNLP/ircot

这里IRCOT的实现最为简单，我们那这篇论文作为基准论文。IRCOT的整个流程是。

Retrieve：用户Query进来直接去检索
COT：检索内容作为上文，使用以下prompt进行COT推理，只保留COT推理的第一个段落
Retrieve：使用上一步推理的句子直接作为Query取进行搜索
COT：使用当前检索到的全部上文，之前COT推理完成的段落，再继续进行推理并保留第一个句子。
不断重复Retrieve，COT直到模型给出"The answer is"，或者超过最大迭代步骤

IRCOT的几个特点包括。

没有全局的规划：每一步都是先检索再向前推理一步
没有Query生成：Query直接来自上一步推理的COT，没有额外生成
直接推理生成：COT是直接基于检索，和前面的推理结果进行继续生成
每一步都独立推理: 不会修改前面的生成结果

以下是基于检索内容生成COT推理的prompt格式。

Wikipedia Title: <Page Title>
<Paragraph Text>
...
Wikipedia Title: <Page Title>
<Paragraph Text>
Q: <Question>
A: <CoT-Sent-1> ... <CoT-Sent-n>

全局 + 生成：Search in the chain

Search-in-the-Chain: Towards Accurate, Credible and Traceable Large Language Models for Knowledge-intensive Tasks

https://github.com/xsc1234/Search-in-the-Chain

对比前面的IRCOT，Search in the chain会预先生成全局规划，并且规划的步骤中增加了子问题的拆解生成。每一步检索后，都根据检索重新生成新的全局规划。以下是Search in the Chain的实现步骤。

SearchChain：针对问题生成全局的SearchChain，包括问题拆解的多个子query，并且每个子问题会让模型判断能否直接回答

能：直接给出[Answer]
不能: 给出[Unsolved Query]

Retrieve：把以上的全局SearchChain按结构拆分成多个步骤，第一步的query先去进行检索
Revise or Generate：根据第一个节点的检索结果，如果当初模型判断这个节点子问题无法回答(Unsolved Query)则根据检索进行生成，如果当初模型判断可以回答但答案和检索不一致，则根据检索进行修订，两种逻辑的prompt不同，会根据searhChain选择不同的prompt拼接到模型的上文
Revise SearchChain: 然后新的上文，让模型重新生成新的SearchChain，再接着遍历下一个节点进行步骤2~3，直到结束

SearchChain的几个特点包括。

全局预规划
Query预生成：Query就是全局规划中拆分的子问题
允许基于前一步的检索结果调整全局规划，但其实之所以需要调整，就是因为query和规划是一起做的，所以当中间推理答案错误的时候，下一步的query生成也会存在问题，所以需要重新生成

以下是Search in the chain构建search chain的prompt 。

全局 + 修订：RAT

Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation

https://github.com/CraftJarvis/RAT

对比Search Chain，RAT也是生成全局规划，但是把query生成的步骤，放到了检索之后，同时把基于检索重新生成的方案，替换成了基于检索对初始回答进行修正。RAT的整体流程是。

COT：用户query进来先让模型进行COT推理，然后把COT按\n\n分成多个段落（step）
ToQuery：针对第1个段落的推理生成检索Query
Retrieve：基于检索query发起检索
Revise: 使用检索结果，对第1个段落进行修订
TOQuery：针对第1个修订段落+第2个原始段落生成检索Query
Retrieve：基于检索query发起检索
Revise: 使用检索结果，对前面的所有段落进行修订
遍历各个段落重复ToQuery，Retrieve，Revise的步骤直到结束

RAT的几个特点包括。

全局预规划
串行Query生成，并使用全部历史信息：每一步Query生成，都是用前面生成的全部信息。更不容易丢失核心主体信息，但同时可能会让Query过于宽泛不够具体。
修订而非生成：使用检索结果修改原始推理而非直接生成，能更多保留模型压缩的知识效果，但是存在内容检索不全，修订后的答案还是有错误存在的可能。
每一步都修订前面的所有内容：成本更高，但可能会有更好的连贯性，但也有可能因为多次修订而引入幻觉

以下分别为第一步COT回答的Prompt，query生成的prompt和基于检索内容的COT进行。

想看更全的大模型论文·微调预训练数据·开源框架·AIGC应用 >> DecryPrompt 。

最后此篇关于解密prompt系列44.RAG探索模式？深度思考模式？的文章就讲到这里了,如果你想了解更多关于解密prompt系列44.RAG探索模式？深度思考模式？的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

56

4

0

文章推荐：基于.NET8+Vue3开发的权限管理&个人博客系统

文章推荐：谈谈Python中的接口与抽象基类

文章推荐：规模法则（ScalingLaw）与参数效率的提高，

文章推荐：渗透测试-前端验签绕过之SHA256

了解Transformers是如何“思考”的
Transformer 模型是 AI 系统的基础。已经有了数不清的关于 "Transformer 如何工作" 的核心结构图表。但是这些图表没有提供任何直观的计算该
sphinx - 思考 Sphinx 索引性能
我有一个很大的索引定义，索引需要很长时间。我怀疑主要问题是由生成的许多 LEFT OUTER JOIN 引起的。我看到了 this question ，但找不到有关使用 source: :query
scala - 思考 Elm 中所见模式的名称以及是否有其他类似情况
我目前是FP的学生。当我查看不同函数式语言提供的不同语法时，我在 Elm 示例代码中遇到了一个模式。我对此很好奇。这是示例代码 myList = [{foo = "bar1"},{foo = "ba
css - 响应式设计中的 'zoom' 思考
我正在尝试使用 HTML 和 CSS 进行响应式设计，这是我的问题: 如果你只调整窗口大小，布局适合，如果你只缩放，布局再次适合，我没有问题，但是如果在调整窗口大小时缩放，布局会中断一点。找到有关此
sorting - 思考 sphinx 在多个字段上排序
我正在寻找模型项目。项目属于公司，因此列表中的所有项目都可以附加相同的公司。结果列表示例: CompanyA - ProjectA CompanyA - ProjectO CompanyA - Pro
c++ - 用 C++ 思考？
我使用的编程语言是 Java。我一直在过渡到有些困难的 C++。 “难懂”不在学习中，更多的是“用 C++ 思考”。我看到很多人说你应该先学习C(我在技术上已经知道了)，然后我看到有人说不要跳过C直
ruby-on-rails - 思考 Sphinx 分面搜索实现示例？
我正在整理一个存储库类型的 rails 3 站点。我安装了 Thinking Sphinx 并在我的网站上工作，因为我可以输入类似 localhost:3000/articles?search=te
ruby-on-rails - 思考 sphinx 不索引新添加的记录
我正在使用 sphinx 搜索 2 个模型及其关联。我正在使用增量索引。在开发模式 (Ubuntu) 下，我的开发箱上一切正常。但是，在暂存盒生产环境中，当我创建新记录时，我需要再次构建索引以使新创建
ruby-on-rails - 思考 sphinx 三角洲指数不起作用
我已将 delta 列添加到我的表中: class AddDeltaIndexToCimgs < ActiveRecord::Migration def change add_column
ruby-on-rails - 思考 sphinx 无法配置开发配置
我安装了think sphinx，运行 rake ts:index 后，无法配置开发文件。文件已创建，但它是空的。 Generating configuration to /Users/lexi87/
ruby-on-rails - 思考 sphinx 不索引某些模型
这很奇怪。我有 3 个模型(A、B、C)。当 crontab 运行它时，我们工作得很好。最近，我在为模型 A 索引新条目时遇到问题。当我手动调用 rake ts:index RAILS_ENV=p
mysql - 思考 sphinx/mysql 用于非文本搜索
如果我的搜索包含类别(外键)和可选文本，我是否应该使用 Thinking sphinx 来“搜索”未提交搜索字符串(仅提交类别)的地方？最佳答案这实际上取决于您的用例。举例来说，假设您有博客文章，
c++ - 用 C++ 思考，内联函数功能？
以下代码来自Thinking in C++。作者提到“由于 operator[] 是内联的，您可以使用这种方法来保证不会发生数组边界违规，然后删除传送代码的 require()。”这里指的是内联函数的
ruby-on-rails - 思考 Sphinx 增量索引在生产中失败
这是我确定的: Delta 索引在开发中运行良好当我推送到生产服务器时，Delta 索引不起作用，并且 searchd.log 中没有记录任何操作我正在运行 Phusion Passenger，并
PHP 和 SQL Server - 思考
最近接了一个项目，性质比较独特，想请教大家一些建议。我分别使用 asp.net/SQL Server 和 php/mysql。我从来没有把它们混为一谈。但是，我当前的项目要求我在使用 SQL Ser
ruby-on-rails - 用 Ruby 思考
我目前正忙于学习 Ruby 和 Rails，并且由于我有基于 C 语言的背景，Ruby 的一些概念是新的并且有些陌生。对我来说特别具有挑战性的是适应处理常见问题的“Ruby 方式”，因此我经常发现自己
ruby-on-rails - 思考 sphinx rails 不运行
每次我尝试在 Mac OSX Snow Leopard 上运行带有 Rails 3 的 Sphinx 2.0.1 时，我都会收到以下错误: Failed to start searchd daemon
c# - 用 TDD 思考 OO——从哪里开始？
我正在努力提高我的 TDD/OO 技能，但每次我尝试使用 TDD 来影响设计时，我都会遇到从哪里开始的障碍。这是我的用例/故事: Identify a subset of clients that
javascript - jQuery:思考 on() 而不是 live() ，在动态生成的东西上传播
得到这个 HTML: Un Deux Trois mother 在页面中，但是 children，select 和 input 都是动态生成的试着用类似
javascript - 具有 javascript 背景的 angularJS 思考
我以前使用过 javascript，但现在我开始使用 angularjs，但我对如何做基本的事情感到困惑。例如:在 JavaScript 中: //here is how i create a c

首页

博学

6Ren·AI

商城