- VisualStudio2022插件的安装及使用-编程手把手系列文章
- pprof-在现网场景怎么用
- C#实现的下拉多选框,下拉多选树,多级节点
- 【学习笔记】基础数据结构:猫树
前一阵多步RAG的风吹入了工业界,kimi推出了探索版本,各应用都推出了深度搜索,You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的实现。之前学术界在讨论multi-hop RAG的时候总是给一些基于历史知识类的问题,什么某年诺贝尔奖的获奖人在哪读的大学呀,给人一种错觉就是这类问题现实世界里真的有人这么提问么?其实还真有! 。
这里举几个单步RAG效果可能不好的case,在碰到的很多场景里,多步RAG其实主要针对模糊指代的问题,包括 。
前面说单步RAG可能解决不好,因为以上的场景当你幸运的召回了正确的数据时,包括但不限于query改写拆解引入相关信息,检索部分解决了时效性问题,模型自身压缩知识的辅助等等,其实是有可能解决的,当然需要碰运气哈哈哈~~ 。
例如华为手机刚发布大热,那你不需要获取华为最新的手机号,直接使用搜索引擎搜索“华为最新型号的手机市场怎么看”,这时搜索引擎已经帮你处理了热点的时效性问题,大概率你就能获得正确的答案.
再比如"光伏上下游产业链近期有哪些利好政策",可能把query拆解为光伏上游产业链利好政策+光伏中游产业链利好政策+光伏下游产业链利好政策,你不需要知道上中下游具体是啥,也是能检索到部分有效信息的.
但是!我们需要的是可以稳定解决复杂,多条件,模糊指代问题的方案! 。
所以下面我们会给出多步RAG的几个核心步骤和对比,再讨论几篇论文大致的实现方案,论文细节大家感兴趣可以自己去看。更多RAG query改写,召回,粗排,精排的多个步骤我们在前面的章节已经说过,这里就不提了~ 。
懒得看具体方案的小伙伴直接看对比吧,这里总结对比下多步RAG的几个核心模块,和几种实现方案 。
模块 | 方案1 | 方案2 | 方案3 | 对比 |
---|---|---|---|---|
规划模块/COT | 每次只基于上一步的检索规划下一步的局部规划方案 | 全局预规划 | 先全局预规划再进行修订 | 局部规划方案容易歪楼,有时会缺少整体视角;全局规划是否需要修订其实部分取决于拆分步骤的方式,如果拆分过程不和query耦合其实多数场景不用修订也是可以的 |
子Query生成 | 和规划等同(规划本身就是子Q) | 和规划一起全局生成 | 依赖前面的的检索结果生成(全部or上一步) | 方案2和3结合的方式更常见,依赖检索结果的Query提供更加specific的检索视角,而只依赖主Q拆分的子Q提供更加general的检索视角 |
推理 | 每一步独立推理拼接最后润色 | 获得所有检索结果后一体生成 | 每一步基于上一步的推理和新获得的检索内容向后续写 | 连贯性最好幻觉较低,但对模型长文本有更高要求的肯定是一体化生成方案类似Kimi;You.COM的生成结果更类似于多步推理再拼接润色;而对于一些超长文本生成续写的方案使用更多 |
在尝试过You.COM的Genius模式,Kimi的探索模式,智谱的深度搜索后,发现除了以上的核心模块,多步RAG还有以下几个可以进一步提升效果的方向 。
- Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions
- https://github.com/StonyBrookNLP/ircot
这里IRCOT的实现最为简单,我们那这篇论文作为基准论文。IRCOT的整个流程是 。
IRCOT的几个特点包括 。
以下是基于检索内容生成COT推理的prompt格式 。
Wikipedia Title: <Page Title>
<Paragraph Text>
...
Wikipedia Title: <Page Title>
<Paragraph Text>
Q: <Question>
A: <CoT-Sent-1> ... <CoT-Sent-n>
- Search-in-the-Chain: Towards Accurate, Credible and Traceable Large Language Models for Knowledge-intensive Tasks
- https://github.com/xsc1234/Search-in-the-Chain
对比前面的IRCOT,Search in the chain会预先生成全局规划,并且规划的步骤中增加了子问题的拆解生成。每一步检索后,都根据检索重新生成新的全局规划。以下是Search in the Chain的实现步骤 。
SearchChain的几个特点包括 。
以下是Search in the chain构建search chain的prompt 。
- Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation
- https://github.com/CraftJarvis/RAT
对比Search Chain,RAT也是生成全局规划,但是把query生成的步骤,放到了检索之后,同时把基于检索重新生成的方案,替换成了基于检索对初始回答进行修正。RAT的整体流程是 。
RAT的几个特点包括 。
以下分别为第一步COT回答的Prompt,query生成的prompt和基于检索内容的COT进行 。
想看更全的大模型论文·微调预训练数据·开源框架·AIGC应用 >> DecryPrompt 。
最后此篇关于解密prompt系列44.RAG探索模式?深度思考模式?的文章就讲到这里了,如果你想了解更多关于解密prompt系列44.RAG探索模式?深度思考模式?的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
Transformer 模型是 AI 系统的基础。已经有了数不清的关于 "Transformer 如何工作" 的核心结构图表。 但是这些图表没有提供任何直观的计算该
我有一个很大的索引定义,索引需要很长时间。我怀疑主要问题是由生成的许多 LEFT OUTER JOIN 引起的。 我看到了 this question ,但找不到有关使用 source: :query
我目前是FP的学生。当我查看不同函数式语言提供的不同语法时,我在 Elm 示例代码中遇到了一个模式。我对此很好奇。 这是示例代码 myList = [{foo = "bar1"},{foo = "ba
我正在尝试使用 HTML 和 CSS 进行响应式设计,这是我的问题: 如果你只调整窗口大小,布局适合,如果你只缩放,布局再次适合,我没有问题,但是如果在调整窗口大小时缩放,布局会中断一点。 找到有关此
我正在寻找模型项目。项目属于公司,因此列表中的所有项目都可以附加相同的公司。结果列表示例: CompanyA - ProjectA CompanyA - ProjectO CompanyA - Pro
我使用的编程语言是 Java。我一直在过渡到有些困难的 C++。 “难懂”不在学习中,更多的是“用 C++ 思考”。 我看到很多人说你应该先学习C(我在技术上已经知道了),然后我看到有人说不要跳过C直
我正在整理一个存储库类型的 rails 3 站点。 我安装了 Thinking Sphinx 并在我的网站上工作,因为我可以输入类似 localhost:3000/articles?search=te
我正在使用 sphinx 搜索 2 个模型及其关联。我正在使用增量索引。在开发模式 (Ubuntu) 下,我的开发箱上一切正常。但是,在暂存盒生产环境中,当我创建新记录时,我需要再次构建索引以使新创建
我已将 delta 列添加到我的表中: class AddDeltaIndexToCimgs < ActiveRecord::Migration def change add_column
我安装了think sphinx,运行 rake ts:index 后,无法配置开发文件。文件已创建,但它是空的。 Generating configuration to /Users/lexi87/
这很奇怪。我有 3 个模型(A、B、C)。当 crontab 运行它时,我们工作得很好。 最近,我在为模型 A 索引新条目时遇到问题。 当我手动调用 rake ts:index RAILS_ENV=p
如果我的搜索包含类别(外键)和可选文本,我是否应该使用 Thinking sphinx 来“搜索”未提交搜索字符串(仅提交类别)的地方? 最佳答案 这实际上取决于您的用例。举例来说,假设您有博客文章,
以下代码来自Thinking in C++。作者提到“由于 operator[] 是内联的,您可以使用这种方法来保证不会发生数组边界违规,然后删除传送代码的 require()。”这里指的是内联函数的
这是我确定的: Delta 索引在开发中运行良好 当我推送到生产服务器时,Delta 索引不起作用,并且 searchd.log 中没有记录任何操作 我正在运行 Phusion Passenger,并
最近接了一个项目,性质比较独特,想请教大家一些建议。 我分别使用 asp.net/SQL Server 和 php/mysql。我从来没有把它们混为一谈。但是,我当前的项目要求我在使用 SQL Ser
我目前正忙于学习 Ruby 和 Rails,并且由于我有基于 C 语言的背景,Ruby 的一些概念是新的并且有些陌生。对我来说特别具有挑战性的是适应处理常见问题的“Ruby 方式”,因此我经常发现自己
每次我尝试在 Mac OSX Snow Leopard 上运行带有 Rails 3 的 Sphinx 2.0.1 时,我都会收到以下错误: Failed to start searchd daemon
我正在努力提高我的 TDD/OO 技能,但每次我尝试使用 TDD 来影响设计时,我都会遇到从哪里开始的障碍。 这是我的用例/故事: Identify a subset of clients that
得到这个 HTML: Un Deux Trois mother 在页面中,但是 children,select 和 input 都是动态生成的 试着用类似
我以前使用过 javascript,但现在我开始使用 angularjs,但我对如何做基本的事情感到困惑。 例如:在 JavaScript 中: //here is how i create a c
我是一名优秀的程序员,十分优秀!