大模型应用开发初探:快速直观感受RAG

转载作者：撒哈拉更新时间：2024-09-23 10:26:49

56

4

大家好，我是Edison.

上一篇，我们了解了什么如何让一些开源小参数量模型具有函数调用的能力。这一篇，我们来快速了解下RAG（检索增强生成）并通过一个简单的DEMO来直观感受一下它的作用.

RAG是什么？

检索增强生成（Retrieval Augmented Generation），简称 RAG，它是根据用户输入的提示词，通过自有垂域数据库检索相关信息，然后合并成为一个新的“完备的“提示词，最后再给大模型生成较为准确的回答.

例如，假设你正在构建问答聊天机器人，以帮助员工回答有关公司专有文档的问题。如果没有专门的培训，独立的 LLM 将无法准确回答有关这些文档的内容的问题，因为这些 LLM 都是基于互联网上公开的数据训练的。LLM 可能会因为缺乏信息而拒绝回答，或者更糟的是，它可能会生成不正确的响应.

为了解决这个问题，RAG 首先根据用户的查询从公司文档检索相关信息，然后将检索到的信息作为额外的上下文提供给 LLM。这样，LLM 就可以根据在相关文档中找到的特定详细信息生成更准确的响应。从本质上讲，RAG 使 LLM 能够“咨询”检索到的信息来表述其答案.

一般的RAG工作流程如下图所示，它实现了非参数事实知识和逻辑推理能力的解耦或分离，这些事实知识存储在外部知识库中独立管理和更新，确保LLM能够访问到就行.

综上所述，RAG其实类似于大学期末的开卷考试，反正知识点都在书里，你平时都没学过，得先找一找，找到了就把相关答案写在试卷上，考完了还是忘得一干二净，但是你的目标达到了：考试及格60分万岁！对于LLM来说，它完成了任务，给你了一个至少可以有60分的回答。下面总结下:

检索（Retrieve）：根据用户提示词从知识库中获取相关知识上下文。
增强（Augment）：将用户的原始提示词和获取到的知识进行合并，形成一个新的提示词。
生成（Generate）：将增强后的新提示词发给LLM进行输出。

直观感受RAG

这里我们就不深究RAG的更多细节内容了，先来通过一个DEMO直观感受下RAG到底有什么作用。至于那些更多的细节内容，留到后续学习实践后，再总结分享.

这仍然是一个WindowsForm的DEMO应用，界面如下:

（1）在没有使用RAG时的查询。

（2）使用RAG：导入内部知。

（3）使用RAG：检索增强查询。

可以看到，基于导入的内部知识，LLM能够基于RAG获得这些知识片段，然后结合用户的问题和知识片段来生成较为准确的答案.

DEMO要点

（1）配置文件

DEMO中LLM使用的是Qwen2-7B-Instruct的模型，Embedding使用的是bge-m3模型，具体的配置如下:

{
  "OpenAI": {
    "API_PROVIDER": "SiliconCloud",
    "API_CHATTING_MODEL": "Qwen/Qwen2-7B-Instruct",
    "API_EMBEDDING_MODEL": "BAAI/bge-m3",
    "API_BASE_URL": "https://api.siliconflow.cn",
    "API_KEY": "**********************" // Update this value to yours
  },
  "TextChunker": {
    "LinesToken": 100,
    "ParagraphsToken": 1000
  }
}

（2）使用组件

使用到的组件包主要有两个:

Microsoft.SemanticKernel 1.19.0 。
Microsoft.SemanticKernel.Connectors.OpenAI 1.19.0 。
Microsoft.SemanticKernel.Connectors.Sqlite 1.19.0-alpha 。

可以看到这里使用的是一个本地数据Sqlilte来作为向量数据库存储，因为我们这个仅仅是个快速的DEMO，实际中可能会考虑选择更为适合的DB。需要注意的是，这里Sqlite这个包是个预览版，你在Nuget管理器中需要注意下勾选包含预览版才能搜索得到.

也正因为这个预览版，很多用法都有警告提示，所以最好在代码中加上下面这些将其禁用掉:

#pragma warning disable SKEXP0050
#pragma warning disable SKEXP0001
#pragma warning disable SKEXP0020
#pragma warning disable SKEXP0010
public partial class ChatForm : Form
{
    ......
}

（3）Embedding

private void btnEmbedding_Click(object sender, EventArgs e)
{
    var query = new QueryModel(tbxIndex.Text, tbxPrompt.Text);
    _textMemory = this.GetTextMemory().GetAwaiter().GetResult();
    var lines = TextChunker.SplitPlainTextLines(query.Text, _textChunkerLinesToken);
    var paragraphs = TextChunker.SplitPlainTextParagraphs(lines, _textChunkerParagraphsToken);

    foreach (var para in paragraphs)
    {
        Task.Run(() =>
        {
            ShowProcessMessage("AI is embedding your content now...");
            _textMemory.SaveInformationAsync(
                query.Index,
                id: Guid.NewGuid().ToString(),
                text: para)
            .GetAwaiter()
            .GetResult();
            ShowProcessMessage("Embedding success!");
            MessageBox.Show("Embedding success!", "Information", MessageBoxButtons.OK, MessageBoxIcon.Information);
        });
    }
}

private async Task<ISemanticTextMemory> GetTextMemory()
{
    var memoryBuilder = new MemoryBuilder();
    var embeddingApiClient = new HttpClient(new OpenAiHttpHandler(_embeddingApiConfiguration.Provider, _embeddingApiConfiguration.EndPoint));
    memoryBuilder.WithOpenAITextEmbeddingGeneration(
        _embeddingApiConfiguration.ModelId,
        _embeddingApiConfiguration.ApiKey,
        httpClient: embeddingApiClient);
    var memoryStore = await SqliteMemoryStore.ConnectAsync("memstore.db");
    memoryBuilder.WithMemoryStore(memoryStore);
    var textMemory = memoryBuilder.Build();

    return textMemory;
}

在Click事件中，调用GetTextMemory方法进行真正的Embedding操作，然后进行数据持久化到本地的Sqlite数据库。在GetTextMemory这个方法中，实现了调用Embedding模型API进行词嵌入.

数据写入Sqlite后打开表后的效果如下图所示。至于这个collection字段，是对应界面中的Index字段，这里我们暂时不用管它.

（4）Generation

private void btnGetRagResponse_Click(object sender, EventArgs e)
{
    if (_textMemory == null)
        _textMemory = this.GetTextMemory().GetAwaiter().GetResult();

    var query = new QueryModel(tbxIndex.Text, tbxPrompt.Text);
    var memoryResults = _textMemory.SearchAsync(query.Index, query.Text, limit: 3, minRelevanceScore: 0.3);

    Task.Run(() =>
    {
        var existingKnowledge = this.BuildPromptInformation(memoryResults).GetAwaiter().GetResult();
        var integratedPrompt = @"
                            获取到的相关信息：[{0}]。
                            根据获取到的信息回答问题：[{1}]。
                            如果没有获取到相关信息，请直接回答 Sorry不知道。
                        ";
        ShowProcessMessage("AI is handling your request now...");
        var response = _kernel.InvokePromptAsync(string.Format(integratedPrompt, existingKnowledge, query.Text))
            .GetAwaiter()
            .GetResult();
        UpdateResponseContent(response.ToString());
        ShowProcessMessage("AI Response:");
    });
}

private async Task<string> BuildPromptInformation(IAsyncEnumerable<MemoryQueryResult> memoryResults)
{
    var information = string.Empty;
    await foreach (MemoryQueryResult memoryResult in memoryResults)
    {
        information += memoryResult.Metadata.Text;
    }

    return information;
}

在Click事件中，将用户的原始提示词和从知识库中获取的知识片段通过一个提示词模板组成另一个增强版的提示词，最后将这个新的提示词发给LLM进行处理回答.

小结

本文简单介绍了一下RAG（检索增强生成）的基本概念和工作流程，然后通过一个简单的DEMO快速直观感受了一下RAG的作用。后续，我们会持续关注RAG的更多细节内容和落地实践.

参考内容

mingupupu大佬的文章：https://www.cnblogs.com/mingupupu/p/18367726 。

示例源码

GitHub：https://github.com/Coder-EdisonZhou/EDT.Agent.Demos 。

推荐学习

Microsoft Learn, 《Semantic Kernel 学习之路》，点击查看原文按钮即可直达。

。

作者：周旭龙。

出处：https://edisonchou.cnblogs.com 。

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接.

最后此篇关于大模型应用开发初探:快速直观感受RAG的文章就讲到这里了,如果你想了解更多关于大模型应用开发初探:快速直观感受RAG的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

56

4

0

文章推荐： acme+cloudflare生成免费证书（自动续期）

文章推荐：【解决方案】Java互联网项目中常见的Redis缓存应用场景

文章推荐：记一次RabbitMQ消费者莫名消失问题的排查

文章推荐： Redis内存突增时，如何定量分析其内存使用情况

c# - Mvvm 模型 View 模型
可不可以命名为MVVM模型？因为View通过查看模型数据。 View 是否应该只与 ViewModelData 交互？我确实在某处读到正确的 MVVM 模型应该在 ViewModel 而不是 Mode
javascript - 模型 -> 观察者 -> View -> Controller -> 模型 ->
我正在阅读有关设计模式的文章，虽然作者们都认为观察者模式很酷，但在设计方面，每个人都在谈论 MVC。我有点困惑，MVC 图不是循环的，代码流具有闭合拓扑不是很自然吗？为什么没有人谈论这种模式: mo
c# - WPF 中的便笺项目。模型、 View 、 View 模型
我正在开发一个 Sticky Notes 项目并在 WPF 中做 UI，显然将 MVVM 作为我的架构设计选择。我正在重新考虑我的模型、 View 和 View 模型应该是什么。我有一个名为 Not
C# 根据模型中的枚举属性将列表<模型> 转换为字典<枚举，列表<模型>>？
不要混淆:How can I convert List to Hashtable in C#? 我有一个模型列表，我想将它们组织成一个哈希表，以枚举作为键，模型列表(具有枚举的值)作为值。 publi
c# - 实体 vs 模型 vs View 模型
我只是花了一些时间阅读这些术语(我不经常使用它们，因为我们没有任何 MVC 应用程序，我通常只说“模型”)，但我觉得根据上下文，这些意味着不同的东西: 实体这很简单，它是数据库中的一行: 2) In
c# - 在大型应用程序中使用 MVVM - 共享 View 模型、模型、状态等
我想知道你们中是否有人知道一些很好的教程来解释大型应用程序的 MVVM。我发现关于 MVVM 的每个教程都只是基础知识解释(如何实现模型、 View 模型和 View )，但我对在应用程序页面之间传递
swift - 清除 Realm 中除一种对象类型(模型)之外的所有对象类型(模型)的方法
我想realm.delete() 我的 Realm 中除了一个模型之外的所有模型。有什么办法可以不列出所有这些吗？也许是一种遍历 Realm 中当前存在的所有类型的方法？最佳答案您可以从您的 R
php - Mocking Laravel Eloquent 模型 - AppServiceProvider 中使用的 Mocking 模型
我正在尝试使用 alias 指令模拟一个 Eloquent 模型，如下所示: $transporter = \Mockery::mock('alias:' . Transporter::class)
R Stargazer 与 pglm 模型 - 在 plm 模型中转换二项式 pglm 模型
我正在使用 stargazer 创建我的 plm 汇总表。 library(plm) library(pglm) data("Unions", package = "pglm") anb1 <- pl
ASP.NET MVC + EF 4.1 分层、模型、 View 模型
我读了几篇与 ASP.NET 分层架构相关的文章和问题，但是读得太多后我有点困惑。 UI 层是在 ASP.NET MVC 中开发的，对于数据访问，我在项目中使用 EF。我想通过一个例子来描述我的问题
ios -/ml 模型/Inception V3.ml 模型 : unable to read document
我收到此消息错误: Inceptionv3.mlmodel: unable to read document 我下载了最新版本的 xcode。 9.4 版测试版 (9Q1004a) 最佳答案您没有
c# - ASP.NET MVC3 Automapper View 模型/模型 View 验证
(同样，一个 MVC 验证问题。我知道，我知道......) 我想使用 AutoMapper ( http://automapper.codeplex.com/ ) 来验证我的创建 View 中不在我
android - 如何使用 sharedview 模型 koin android 注入(inject)具有作用域的 View 模型
需要澄清一件事，现在我正在处理一个流程，其中我有两个 View 模型，一个依赖于另一个 View 模型，为了处理这件事，我尝试在我的基本 Activity 中注入(inject)两个 View 模型，
wpf - 如何在 Window.Resources 标签中使用带有数据绑定(bind)的 View 模型、模型、命令类？
如果 WPF MVVM 应该没有代码，为什么在使用 ICommand 时，是否需要在 Window.xaml.cs 代码中实例化 DataContext 属性？我已经并排观看并关注了 YouTube
asp.net - 模型-存储库-服务-验证器- View - View 模型- Controller 设计模式(？)
当我第一次听说 ASP.NET MVC 时，我认为这意味着应用程序由三个部分组成:模型、 View 和 Controller 。然后我读到 NerdDinner并学习了存储库和 View 模型的方法
python - 如何使用 mmconvert 将 tensorflow 模型(InceptionResnetV2 pb 文件)转换为 pytorch 模型？
Platform : ubuntu 16.04 Python version: 3.5.2 mmdnn version : 0.2.5 Source framework with version :
swift - 在 super.init 初始化 self super.init 之前，在属性访问 'self' 中使用 'model'(品牌 : brand, 模型:模型)
我正在学习本教程:https://www.raywenderlich.com/160728/object-oriented-programming-swift ...并尝试对代码进行一些个人调整，看看
AngularJS 模型
我正试图围绕 AngularJS。我很喜欢它，但一个核心概念似乎在逃避我——模型在哪里？例如，如果我有一个显示多个交易列表的应用程序。一个列表向服务器查询匹配某些条件的分页事务集，另一个列表使用不同
模型、业务规则和持久性
我在为某个应用程序找出最佳方法时遇到了麻烦。我不太习惯取代旧 TLA(三层架构)的新架构，所以这就是我的来源。在为我的应用程序(POCO 类，对吧？？)设计模型和 DAL 时，我有以下疑问: 我的模
Django - 模型 - 如何描述两个模型之间的特定双向关系？
我有两个模型:Person 和 Department。每个人可以在一个部门工作。部门可以由多人管理。我不确定如何在 Django 模型中构建这种关系。这是我不成功的尝试之一 [models.py]:

首页

博学

6Ren·AI

商城