- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
import { Configuration, OpenAIApi } from "openai"
import { readFile } from './readFile.js'
// Config OpenAI API
const configuration = new Configuration({
organization: "xyx......",
apiKey: "abc.......",
});
// OpenAI API instance
export const openai = new OpenAIApi(configuration);
const generateAnswer = async (conversation, userMessage) => {
try {
const dataset = await readFile();
const dataFeed = { role: 'system', content: dataset };
const prompt = conversation ? [...conversation?.messages, dataFeed, userMessage] : [dataFeed, userMessage];
const completion = await openai.createChatCompletion({
model: "gpt-3.5-turbo",
messages: prompt
})
const aiMessage = completion.data.choices[0].message;
console.log(completion.data.usage)
return aiMessage
} catch (e) {
console.log(e)
}
}
export { generateAnswer };
我正在尝试创建聊天机器人,其中我在开始时提供数据馈送,这是聊天 api 的业务信息和对话历史记录我想在进行 api 调用之前计算对话的 token 并在超出限制时减少提示我尝试过使用 gpt3 编码器来计算 token ,但我的对象数组不是提示中的字符串
最佳答案
精确的方法是使用 tiktoken ,它是一个 python 库。摘自openAI cookbook:
import tiktoken
encoding = tiktoken.encoding_for_model("gpt-3.5-turbo")
num_tokens = len(encoding.encode("Look at all them pretty tokens"))
print(num_tokens)
更一般地,您可以使用
encoding = tiktoken.get_encoding("cl100k_base")
where cl100k_base
用于 gpt-4、gpt-3.5-turbo、text-embedding-ada-002;p50k_base
用于 Codex 模型、text-davinci-002、text-davinci-003; r50k_base 是 gpt2 和 davinci 等 GPT-3 模型中使用的内容。 r50k_base
和 p50k_base
通常(但并非总是)给出相同的结果。
您通常只是希望程序不会因超出 token 限制而崩溃,并且只需要一个字符计数截止,这样您就不会超出 token 限制。使用 tiktoken 进行的测试表明,代币计数通常是线性的,特别是对于较新的模型,并且 1/e 似乎是一个稳健的保守比例常数。因此,我们可以编写一个简单的方程来保守地将标记与字符相关联:
'#tokens
哪里
现在反转此操作以获得适合 token 限制的最大字符数:
'max_characters = (#tokens_limit - safety_margin) * e'
其中 e = 2.7182818284590...现在您已经有了一个即时的、独立于语言和平台且无依赖性的解决方案,可以不超过 token 限制。
对于带有英文文本的模型 cl100k_base,#tokens = #chars0.2016568976249748 + -5.277472848558375对于带有英文文本的模型 p50k_base,#tokens = #chars0.20820463015644564 + -4.697668008159241对于带有英文文本的模型 r50k_base,#tokens = #chars*0.20820463015644564 + -4.697668008159241
对于具有 Lorem ipsum 的模型 cl100k_base,#tokens = #chars0.325712437966849 + -5.186204883743613对于具有 Lorem ipsum 的模型 p50k_base,#tokens = #chars0.3622005352481815 + 2.4256199405020595对于具有 Lorem ipsum 的模型 r50k_base,#tokens = #chars*0.3622005352481815 + 2.4256199405020595
对于带有sampletext2的模型cl100k_base,#tokens = #chars0.2658446137873485 + -0.9057612056294033对于带有sampletext2的模型p50k_base,#tokens = #chars0.3240730228908291 + -5.740016444496973对于带有sampletext2的模型r50k_base,#tokens = #chars*0.3754121847018643 + -19.96012603693265
关于node.js - 在进行 api 调用之前如何计算 token ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76216113/
我已经设置了 Azure API 管理服务,并在自定义域上配置了它。在 Azure 门户中 API 管理服务的配置部分下,我设置了以下内容: 因为这是一个客户端系统,我必须屏蔽细节,但以下是基础知识:
我是一名习惯 React Native 的新程序员。我最近开始学习 Fetch API 及其工作原理。我的问题是,我找不到人们使用 API key 在他们的获取语句中访问信息的示例(我很难清楚地表达有
这里有很多关于 API 是什么的东西,但是我找不到我需要的关于插件 API 和类库 API 之间的区别。反正我不明白。 在 Documenting APIs 一书中,我读到:插件 API 和类库 AP
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
我正在尝试找出设计以下场景的最佳方法。 假设我已经有了一个 REST API 实现,它将从不同的供应商那里获取书籍并将它们返回给我自己的客户端。 每个供应商都提供单独的 API 来向其消费者提供图书。
请有人向我解释如何使用 api key 以及它有什么用处。 我对此进行了很多搜索,但得到了不同且相互矛盾的答案。有人说 API key 是保密的,它从不作为通信的一部分发送,而其他人则将它发送给客户端
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 可以用事实和引用来回答它. 4年前关闭。 Improve this
谁能告诉我为什么 WSo2 API 管理器不进行身份验证?我已经设置了两个 WSo2 API Manager 1.8.0 实例并创建了一个 api。它作为原型(prototype) api 工作正常。
我在学习 DSL 的过程中遇到了 Fluent API。 我在流利的 API 上搜索了很多……我可以得出的基本结论是,流利的 API 使用方法链来使代码流利。 但我无法理解——在面向对象的语言中,我们
基本上,我感兴趣的是在多个区域设置 WSO2 API 管理器;例如亚洲、美国和欧洲。一些 API 将部署在每个区域的数据中心内,而其他 API 将仅部署在特定区域内。 理想情况下,我想要的是一个单一的
我正在构建自己的 API,供以下用户使用: 1) 安卓应用 2) 桌面应用 我的网址之一是:http://api.chatapp.info/order_api/files/getbeers.php我的
我需要向所有用户显示我的站点的分析,但使用 OAuth 它显示为登录用户配置的站点的分析。如何使用嵌入 API 实现仪表板但仅显示我的网站分析? 我能想到的最好的可能性是使用 API key 而不是客
我正在研究大公司如何管理其公共(public) API。我想到的是拥有成熟 API 的公司,例如 Google、Facebook、Twitter 和 Amazon。 这些公司向公众公开了许多不同的 A
在定义客户可访问的 API 时,以下是首选的行业惯例: a) 定义一组显式 API 方法,每个方法都有非常狭窄和特定的目的,例如: SetUserName SetUserAge Se
这在本地 deserver 和部署时都会发生。我成功地能够通过留言簿教程使用 API 资源管理器,但现在我已经创建了自己的项目并尝试访问我编写的第一个 API,它从未出现过。搜索栏旁边的黄色“正在加载
我正在尝试使用 http://ip-api.com/ api通过我的ip地址获取经度和纬度。当我访问 http://ip-api.com/json从我的浏览器或使用 curl,它以 json 格式返回
这里的典型示例是 Twitter 的 API。我从概念上理解 REST API 的工作原理,本质上它只是针对您的特定请求向他们的服务器查询,然后您会在其中收到响应(JSON、XML 等),很棒。 但是
我能想到的最好的标题,但要澄清的是,情况是这样的: 我正在开发一种类似短 url 的服务,该服务允许用户使用他们的 Twitter 帐户“登录”并发布内容。现在这项服务可以包含在 Tweetdeck
我正在设计用于管理评论和讨论线程的 API 方案。我想有一个点 /discussions/:discussionId 当您GET 时,它会返回一组评论和一些元数据。评论也许可以单独访问 /discus
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭去年。 Improve this quest
我是一名优秀的程序员,十分优秀!