TypeChat源码分析：基于大语言模型的定制化AIAgent交互规范

转载作者：我是一只小鸟更新时间：2023-08-01 22:31:23

27

4

TypeChat源码分析：基于大语言模型的定制化 AI Agent 交互规范

本文深入介绍了微软最近发布的 TypeChat 项目，该项目允许开发者定义大语言模型返回的响应结构。通过分析源代码，探讨了 Prompt 的基本概念，为定制化开发互动式 AI Agent 提供便捷的解决方案。文章着重介绍 TypeChat 的关键要素，例如集成不同的大语言模型、提高灵活性，并调整输出以适应特定场景，这对于在游戏中通过 AI Agent 实现多样交互至关重要.

在 TypeChat 中，先定义好 ChatGPT 的响应类型，即 Schema, 创建将自然语言请求翻译为特定类型的 JSON 对象的工具函数，将函数列表和问题发送给GPT， GPT根据函数定义，返回要执行的函数名和参数，不同于 Function calling ，它使用 Typescript 类型来作为 Schema ，要求 ChatGPT 返回符合这个类型定义的数据.

因为最近开发一个基于GPT的AI AGENT的游戏，不同的人在地图通过不断的和chatGPT定义角色的NPC聊天交互，然后从NPC那里得到不同的反馈，得到不一样的体验，对于交互的部分，我觉得 tyeChat 就可以很好的交互上的格式问题.

本文对typeChat 其中比较重要的点进行分析:

大模型对接 的地方：目前只是支持了两种大模型，微软自己的Azure的和 OpenAI 的，比如还有很多的大模型如何接入的问题
灵活性的拓展：比如说目前 typeChat 对于类型的定义过于严格，可能要耗费大量的token 以及对于不需要那么严格的场景，比如聊天，只需要有几个关键的key是对的就可以了如何优化

基于 SourceCodeTrace 项目推崇的原则，本文代码块引用均有来源，SourceCodeTrace Project 帮助您在博客、文章记录的过程中，引入对应项目以及版本，行号等信息，让后续的读者，通过引用来源，能够进行更加深入的学习，在博客或文章中引入代码块时，尽量提供代码的来源信息.

核心架构

核心就是对话，校验，修复型对话，得到想要的结构.

                        
                          export function createJsonTranslator<T extends object>(model: TypeChatLanguageModel, schema: string, typeName: string): TypeChatJsonTranslator<T> {
    const validator = createJsonValidator<T>(schema, typeName);
    const typeChat: TypeChatJsonTranslator<T> = {
        model,
        validator,
        attemptRepair: true,
        stripNulls: false,
        createRequestPrompt,
        createRepairPrompt,
        translate
    };
    return typeChat;

/src/typechat.ts?#L65-L76 。

createJsonTranslator 函数是核心部分，它接受三个参数 model、schema 和 typeName，并返回一个包含几个方法和属性的对象 typeChat，该对象用于将自然语言请求转换为指定类型的 JSON 对象.

model：是用于将自然语言请求翻译为 JSON 的大语言模型，目前是支持微软自己的Azure 和 Openai的
schema：是一个包含 JSON schema 的 TypeScript 源代码的字符串。
typeName：是在 schema 中指定的目标 JSON 类型的名称。

返回的 typeChat 对象包含以下几个属性和方法:

model：保存传入的语言模型。
validator：通过调用 createJsonValidator 函数，使用传入的 schema 和 typeName 创建一个 JSON 校验器，并将其保存在 validator 属性中。
attemptRepair：一个布尔值，表示在校验失败时是否尝试修复 JSON 对象。
stripNulls：一个布尔值，表示是否从最终的 JSON 对象中剥离空值（null）属性。
createRequestPrompt(request)：一个函数，用于创建用户请求的 Prompt ，包含 JSON schema 和用户请求的内容。
createRepairPrompt(validationError)：一个函数，检验格式不对的话，修复性的 Prompt ，再次请求。
translate(request)：一个异步函数，用于将用户请求翻译为 JSON 对象。
它使用语言模型 model 来翻译用户请求，并调用 JSON 校验器进行验证。如果验证成功，返回验证结果，否则根据 attemptRepair 的值决定是否尝试修复错误，最终返回修复后的 JSON 对象。

Prompt 的核心

                        
                              function createRequestPrompt(request: string) {
        return `You are a service that translates user requests into JSON objects of type "${validator.typeName}" according to the following TypeScript definitions:\n` +
            `\`\`\`\n${validator.schema}\`\`\`\n` +
            `The following is a user request:\n` +
            `"""\n${request}\n"""\n` +
            `The following is the user request translated into a JSON object with 2 spaces of indentation and no properties with the value undefined:\n`;
    }

/src/typechat.ts?#L78-L84 。

这里面的核心就是对 ChatGpt 做一个角色的定义，定义 ChatGpt 作为一个处理JSON对象的服务，在一个就是 typescript 对对象类型的定义描述给 chatGpt 识别.

当 ChatGpt 回复之后，通过 validation 校验的类型错误，在给 chatGpt 说你的类型不对，具体错误是什么，你需要在输出修改后的JSON对象:

                        
                          
    function createRepairPrompt(validationError: string) {
        return `The JSON object is invalid for the following reason:\n` +
            `"""\n${validationError}\n"""\n` +
            `The following is a revised JSON object:\n`;
    }

/src/typechat.ts?#L85-L90 。

通过这样的一次反馈得到最后需要的格式，但是这个里面如果需要足够的稳定，还需要自行修改源码添加次数，以便达到自己的预期.

增加大模型接口

目前官网里面就支持了两种，微软自己的Azure的和 OpenAI 的ChatGpt，为了探索 TypeChat 核心概念与拓展性，为游戏开发定制 AI Agent 提供便利，还是需要处理这块代码实现不同大模型的对接需求:

                        
                          export function createLanguageModel(env: Record<string, string | undefined>): TypeChatLanguageModel {
    if (env.OPENAI_API_KEY) {
        const apiKey = env.OPENAI_API_KEY ?? missingEnvironmentVariable("OPENAI_API_KEY");
        const model = env.OPENAI_MODEL ?? missingEnvironmentVariable("OPENAI_MODEL");
        const endPoint = env.OPENAI_ENDPOINT ?? "https://api.openai.com/v1/chat/completions";
        const org = env.OPENAI_ORGANIZATION ?? "";
        return createOpenAILanguageModel(apiKey, model, endPoint, org);
    }
    if (env.AZURE_OPENAI_API_KEY) {
        const apiKey = env.AZURE_OPENAI_API_KEY ?? missingEnvironmentVariable("AZURE_OPENAI_API_KEY");
        const endPoint = env.AZURE_OPENAI_ENDPOINT ?? missingEnvironmentVariable("AZURE_OPENAI_ENDPOINT");
        return createAzureOpenAILanguageModel(apiKey, endPoint);
    }
    missingEnvironmentVariable("OPENAI_API_KEY or AZURE_OPENAI_API_KEY");
}

/src/model.ts?#L41-L55 。

这里是两个模型公用的部分，基本的请求结构差不多，定义 Prompt 和 role，然后得到 result.data.choices[0].message?.content 返回值。这里可以修改返回的内容，以及在这里定义每次调用请求的大模型接口，可以通过这个地方，修改为自己定义的接口以及处理自己代码的逻辑.

                        
                          function createAxiosLanguageModel(url: string, config: object, defaultParams: Record<string, string>) {
    const client = axios.create(config);
    const model: TypeChatLanguageModel = {
        complete
    };
    return model;

    async function complete(prompt: string) {
        let retryCount = 0;
        const retryMaxAttempts = model.retryMaxAttempts ?? 3;
        const retryPauseMs = model.retryPauseMs ?? 1000;
        while (true) {
            const params = {
                ...defaultParams,
                messages: [{ role: "user", content: prompt }],
                temperature: 0,
                n: 1
            };
            const result = await client.post(url, params, { validateStatus: status => true });
            if (result.status === 200) {
                return success(result.data.choices[0].message?.content ?? "");
            }
            if (!isTransientHttpError(result.status) || retryCount >= retryMaxAttempts) {
                return error(`REST API error ${result.status}: ${result.statusText}`);
            }
            await sleep(retryPauseMs);
            retryCount++;
        }

/src/model.ts?#L89-L116 。

本文也在持续的更新中，如果你需要得到最新的更新，请访问: TypeChat源码分析：基于大语言模型的定制化 AI Agent 交互规范。

最后此篇关于TypeChat源码分析：基于大语言模型的定制化AIAgent交互规范的文章就讲到这里了,如果你想了解更多关于TypeChat源码分析：基于大语言模型的定制化AIAgent交互规范的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

27

4

0

文章推荐：这些年写过的花式sql-第一句删除重复无效的记录

文章推荐：硬件管理平台-硬件产品库-反射模块

文章推荐：为什么list.sort()比Stream().sorted()更快？

文章推荐： Unity的IPreprocessBuildWithReport：深入解析与实用案例

Python 交互
在 python 交互中，有没有办法在每次输入命令后自动从 python 文件执行方法？例如:如果我有一个打印文件信息的方法，但我不想不断调用该方法，我怎样才能让它在 python 交互中的每个命令
.NETApp与Windows系统媒体控制(SMTC)交互
当你使用Edge等浏览器或系统软件播放媒体时，Windows控制中心就会出现相应的媒体信息以及控制播放的功能，如图。 SMTC (SystemMedia
delphi - 如何防止快捷方式在Delphi中碰撞/交互？
我在主菜单上使用标准的剪切，复制，粘贴操作。它们具有快捷键Ctrl-X，Ctrl-C和Ctrl-V。当我打开模态表单时FindFilesForm.ShowModal，然后所有快捷方式都可以从表单中使
ssh - proc_open 交互
这是我想要实现的目标:打开一个 shell(korn 或 bash，没关系)，从那个 shell，我想打开一个 ssh 连接(ssh user@host)。在某些时候，可能会提示我输入密码，或者可能会
python - 使用python事件并与c++交互
我正在测试在C / C++程序中嵌入Python，但是我缺乏理解。测试程序很简单: 初始化解释器；从启动Timer的文件中执行python脚本(每0.1秒增加一个变量)；等待5秒(C++); 从
java excel 交互
我正在尝试用java创建Excel文件。现在，我正在使用 Apache POI 库创建文件并将其保存到本地驱动器。有没有办法启动 Excel 并填充数据而不将其保存到硬盘驱动器？最佳答案考虑 Do
python - 黑盒功能的交互/交互
我有一个黑盒函数，它接受大约 10 个整数输入。该函数返回一个 pandas 数据框，我想捕获输出窗口(通过使用 bbwidget.children)并显示在布局中的其他地方。到目前为止，交互/交互似
c++ - QQuickWidget与C++交互
我正在体验新的 QQuickWidget。我如何在 QQuickWidget 和 C++ 之间进行交互？ C++ QQuickWidget *view = new QQuickWidget(); vi
C# TWAIN 交互
我正在尝试设置一个使用 TWAIN 的 C# 应用程序 example from code project 除了我需要将 Form 转换为 IMessageFilter 和调用 IMessageFil
Python Redis 交互
我想在使用 redis 的 python 中编写应用程序。我用谷歌搜索，但找不到我的问题的任何结果。通常，我这样做: import redis rs = redis.Redis('localhost'
asp.net中javascript与后台c#交互
最近做一个小项目，网页中嵌入google maps，输入经纬度坐标可以定位地图位置并加注标记，点击标记获取远端摄像头数据并在视频窗口实现播放。在实际操作过程中，由于经纬度数据和视频登录的用户名密码数
PHP 和 Javascript 交互
我需要在这里澄清一些事情: 我有一个网站，每次在浏览器中重新加载网站时都会更新两个变量的值。这个页面显然是一个 HTML 页面，但变量是由 javascript 函数更新的。此页面在我的服务器上运行。
coq - `auto` 如何与条件(if)交互
我注意到，auto忽略双条件。这是一个简化的示例: Parameter A B : Prop. Parameter A_iff_B : A B. Theorem foo1: A -> B. Proo
ipywidgets - 如何与包含小部件的 Box 交互？
使用 interactive使用多个小部件相当简单，例如: interactive(foo, w1=widget1, w2=widget2, ...) 但是，我想使用 VBox 和 HBox 的组合以
javascript - 通过命令行或本地脚本与浏览器 JavaScript 交互？
我们提供类似于 imagemagick 的浏览器页面 JavaScript，可帮助人们将图像转换为不同大小和格式。但是，它需要网页交互。是否可以让人们自动进行这种交互——无需将图像发送到我们的服务器
uikit - 核心图形和 UIKit 交互
大家好，我正在尝试制作一个具有大量动画和效果的交互式 UI。但我不知道是否: 核心图形可以支持用户交互(触摸、拖动等) 核心图形支持对象旋转核心图形可以以任何方式与 UIKit 和核心动画交互谢
php - 与维基百科 API 交互
这是获取维基百科上一篇关于高盛的文章的介绍的链接。 http://en.wikipedia.org/w/api.php?action=query&prop=extracts&titles=Goldma
Applescript 和 iCal 交互
我正在尝试编写一个 AppleScript 来查询 iCal 并在任何日历中查找给定日期的所有事件。我首先编写了一个简单的脚本，它对给定日历中的每个事件执行一些简单的操作: tell applica
SVN Hudson JIRA 交互
我在我的 hudson 服务器上使用 jira 插件。将代码提交到 svn 时，我的提交注释包含在我的 jira 问题中，但有什么办法可以将注释归因于执行提交的实际人员，而不是让一个全局 jira 用
cocoa - 阻止用户与 AVPlayerView 交互？
我正在播放一段视频来装饰我的用户界面。我隐藏了 AV 播放器控件，但用户仍然可以控制视频。例如，他们可以使用滑动手势快进或快退。这让我特别惊讶，因为 AVPlayerView 上面有一个覆盖 Vie

首页

博学

6Ren·AI

商城