openai-api - 如何让ChatGPT返回用自己的数据训练时返回的信息来源-6ren

openai-api - 如何让ChatGPT返回用自己的数据训练时返回的信息来源

转载作者：行者123 更新时间：2023-12-02 05:49:19

25

4

我正在尝试通过将数据存储在矢量数据库(Pinecone)中来使用包含我自己的数据来训练 ChatGPT。我正在使用 ChatGPT 检索插件对数据进行矢量化并将其存储在 Python 中。该插件可以在这里找到:https://github.com/openai/chatgpt-retrieval-plugin

遵循 https://betterprogramming.pub/enhancing-chatgpt-with-infinite-external-memory-using-vector-database-and-chatgpt-retrieval-plugin-b6f4ea16ab8 的指南，到目前为止一切都很好。但是，我在访问元数据(即信息来源)时遇到问题，以便可以是作者或网址等。

我相信这需要在下面的函数中完成，请注意，我自己添加了元数据部分:

def upsert_file(directory: str):
    """
    Upload all files under a directory to the vector database.
    """
    url = "http://0.0.0.0:8000/upsert-file"
    headers = {"Authorization": "Bearer " + DATABASE_INTERFACE_BEARER_TOKEN}
    files = []
    for filename in os.listdir(directory):
        if os.path.isfile(os.path.join(directory, filename)):
            file_path = os.path.join(directory, filename)
            with open(file_path, "rb") as f:
                file_content = f.read()
                # files.append(("file", (filename, file_content, "text/plain")))
                metadata = {
                    "source": filename,  # Add your metadata values
                    "author": "Tim Cook",
                    "url": "Some fake url"
                    # Add more metadata fields as needed
                }
                print(metadata)
                files = {
                    "file": (filename, file_content, "text/plain"),
                    "metadata": (None, json.dumps(metadata), "application/json"),
                }
                # response = requests.post(url, headers=headers, files=files, timeout=600)

            response = requests.post(url,
                                     headers=headers,
                                     files=files,
                                    #  data={"metadata": json.dumps(metadata)},
                                     timeout=600)
            if response.status_code == 200:
                print(filename + " uploaded successfully.")
            else:
                print(
                    f"Error: {response.status_code} {response.content} for uploading "
                    + filename)

我的问题是文件仍然被矢量化/存储在松果中，但元数据仍然返回为None，如下所示:

metadata': {'source': 'file', 'source_id': None, 'url': None, 'created_at': None, 'author': None, 'document_id': 'Some_Doc_Id_here_that_is_not_None'}

我的问题是如何获取元数据？为什么这么多字段都返回 None ？我还应该提到这一行:

"metadata": (None, json.dumps(metadata), "application/json")

如果我要将 None 更改为其他内容，例如 testing，当我尝试更新插入文件时，最终会出现以下错误:

Error: 422 b'{"detail":[{"loc":["body","metadata"],"msg":"str type expected","type":"type_error.str"}]}'

最佳答案

对于遇到同样问题的人来说，元数据显示None的原因是因为元数据必须包含正确的属性。深入研究 GPT 插件的代码，正确的属性是:

class DocumentMetadata(BaseModel):
    source: Optional[Source] = None
    source_id: Optional[str] = None
    url: Optional[str] = None
    created_at: Optional[str] = None
    author: Optional[str] = None

class Source(str, Enum):
    email = "email"
    file = "file"
    chat = "chat"

我为源提供了一个文件名，这不是 Source 对象的有效属性。

我最终将元数据更新为如下所示，现在我可以检索元数据:

metadata = {"source": "file", "source_id": filename, "url": "https://example.com", "created_at":  str(date.today()), "author": "Tim Cook"}

关于openai-api - 如何让ChatGPT返回用自己的数据训练时返回的信息来源，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/76648707/

25

4

0

文章推荐： oracle - 在 Oracle 11g 数据库中使用 OpenAI API (chatgpt)

文章推荐： Flutter chat_gpt_sdk 错误 - 上传的图像必须是 png 且小于 4 mb

文章推荐： vscode-extensions - 未找到命令 'chatgpt.updateAPIkey'

文章推荐： openai-api - 如何从 openAI chat-gpt-4 获取流答案？

ChatGPT 怎么用 : 如何注册 ChatGPT 账号并通过手机号验证
ChatGPT 以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。这么强大的工具我们都想体验一下，那么 ChatGPT 怎么用呢？本文将给你逐步详细介绍。 Chat GPT
openai-api - 如何通过 ChatGPT Api 从 Chatgpt 讨论生成思维导图
我有一个想法创建一个应用程序，可以通过chatgpt api绘制chatgpt讨论的思维导图。但是，如何编写一个提示来控制chatgpt写出固定格式的思维导图以便于解析呢？最佳答案这可以使用 Me
openai-api - 如何通过 ChatGPT Api 从 Chatgpt 讨论生成思维导图
我有一个想法创建一个应用程序，可以通过chatgpt api绘制chatgpt讨论的思维导图。但是，如何编写一个提示来控制chatgpt写出固定格式的思维导图以便于解析呢？最佳答案这可以使用 Me
openai-api - openAI/chatGPT 是否有 API 可以回答多个文件上传的问题？ openAI/chatGPT 文件上传 API 是否支持 docx/pdf 文件？
openAI/chatGPT也支持docx/pdf文件上传吗？我想上传多个文件到 openAI/chatGPT。我尝试了 https://platform.openai.com/docs/api-r
openai-api - openAI/chatGPT 是否有 API 可以回答多个文件上传的问题？ openAI/chatGPT 文件上传 API 是否支持 docx/pdf 文件？
openAI/chatGPT也支持docx/pdf文件上传吗？我想上传多个文件到 openAI/chatGPT。我尝试了 https://platform.openai.com/docs/api-r
Does openAI/chatGPT has an API's to Answer Questions from Multiple File uploads? and Does openAI/chatGPT file upload API support docx/pdf files?(OpenAI/chat GPT是否有API来回答来自多个文件上传的问题？OpenAI/chat GPT文件上传API是否支持docx/pdf文件？)
OpenAI/chat GPT也支持docx/pdf文件上传吗？。我想上传多个文件到openAI/chatGPT。我在https://platform.openai.com/docs/api-refe
ChatGPT-4o模型功能介绍
1.概述 OpenAI 持续突破人工智能的边界，推出了其最新模型 ChatGPT-4o，作为 ChatGPT-4 的继承者，该模型有望带来显著的提升和创新功能。本文将深入解析 ChatGPT-4 与
如何注册OpenAI&ChatGPT
ChatGPT 是OpenAI 发布的一个全新的聊天机器人模型。它到底有多厉害呢？我注册后体验了一下，你会感觉背后有个真人跟你在聊天。例如：代码不仅可以运行，还特么有每行带有中文注释，这完全是降维打
ChatGPT+Mermaid自然语言流程图形化产出小试
ChatGPT+Mermaid语言实现技术概念可视化本文旨在介绍如何使用ChatGPT和Mermaid语言生成流程图的技术。在现代软件开发中，流程图是一种重要的工具，用于可视化和呈现各种流程
ChatGPT，我彻彻底底沦陷了！
当谈到人工智能技术的时候，我们会经常听到GPT这个术语。它代表“Generative Pre-trained Transformer”，是一种机器学习模型，采用了神经网络来模拟人类语言的理解
ChatGPT：让程序开发更轻松
作者：京东科技赵龙波 “贾维斯，你在吗？” “随时待命，先生。” 类似《钢铁侠》里的人工智能助理贾维斯，ChatGPT或许是你的随时待命的助手。ChatGPT在大量文本数据上进行
如何注册 ChatGPT ：最新手把手亲测可用教程
ChatGPT 火爆出圈，但是 OpenAI（开发 ChatGPT 的公司）却不对国内用户正式开放使用。但是，我们仍然有办法可以在第一时间体验到这个超强 AI。下面我来教你如何
OpenAI ChatGPT 接入微信
最近的热门话题，OpenAI 推出的ChatGPT绝对榜上有名！但是不说注册难度，只说每次需要一些不可抗力的原因才能访问使用就很麻烦，大部分人无法体验到，本文介绍的方式直接对接个人微信（不是公众号）非
python - ChatGPT 词嵌入最相似的词
我正在从 ChatGPT API 中提取与单词列表相对应的单词嵌入。我想知道是否有一种类似于Gensimmost_similar方法的方法来提取整个模型中与我想要的术语最相似的n个单词。最佳答案是
streamlit - 流式响应线 chatgpt
有谁知道我是否可以使用 streamlit_chat 消息在 Streamlit 中显示类似 chatgpt 的流响应？我需要类似 message(streaming=True) 或任何其他替代方案
chatgpt-api - 如何在松果矢量数据库服务中分离多个聊天机器人的数据？
我正在构建一个平台，用户可以在其中上传自定义数据并构建聊天机器人。我正在考虑使用 lanchain + open ai embeddings + chat gpt api + pinecone 来管
javascript - chatGPT API函数调用
我正在尝试设置函数来调用我最近一直在从事的一个项目，但我似乎无法让它工作我查找了文档，但只找到了无法很好地解释它的 YouTube 视频。我尝试过运行各种示例，但没有任何效果对我有用。这就是我所拥有
chatgpt-api - 如何一次翻译_多个_字符串？
我正在研究将 html 页面从一种语言翻译成另一种语言的想法——翻译可见文本(如果更具体的话)。我已经将 html 拆分为标记和文本 block ，现在我需要通过 ChatGPT 翻译文本。但对于我的
chatgpt-api - 如何一次翻译_多个_字符串？
我正在研究将 html 页面从一种语言翻译成另一种语言的想法——翻译可见文本(如果更具体的话)。我已经将 html 拆分为标记和文本 block ，现在我需要通过 ChatGPT 翻译文本。但对于我的
python - ChatGPT 词嵌入最相似的词
我正在从 ChatGPT API 中提取与单词列表相对应的单词嵌入。我想知道是否有一种类似于Gensimmost_similar方法的方法来提取整个模型中与我想要的术语最相似的n个单词。最佳答案是

首页

博学

6Ren·AI

商城

openai-api - 如何让ChatGPT返回用自己的数据训练时返回的信息来源