python - Weaviate 与 Azure 认知搜索相结合-6ren

python - Weaviate 与 Azure 认知搜索相结合

转载作者：行者123 更新时间：2023-12-03 06:13:21

30

4

这是我的场景:

客户端有一个 Azure SQL 数据库，其中包含包含人口统计信息的配置文件表。
我们创建了一个 Azure 认知搜索并为该数据库建立了索引，我们将所有字段连接到一个称为内容的字段中。因为根据文档，所有内容都需要在一个字段中。 https://python.langchain.com/docs/modules/data_connection/retrievers/integrations/azure_cognitive_search

现在我们正在使用 LangChain 创建一个聊天机器人，我们可以在其中提出以下问题:约翰·史密斯是谁？，简·史密斯多大了，谁喜欢园艺。

我找到的方法在这里: https://shweta-lodha.medium.com/integrating-azure-cognitive-search-with-azure-openai-and-langchain-51280d1026f2

基本上，首先查询认知搜索并返回一些文档，然后将这些文档作为向量保存在 ChromaDB 中，然后查询 ChromaDB 并使用 langchain 和 openAI 以简单的英语接收结果。

但是 ChromaDB 非常慢。这一步大约需要50秒。

所以我想尝试 weaviate，但后来我得到了非常奇怪的错误，例如:

[ERROR] Batch ConnectionError Exception occurred! Retrying in 2s. [1/3]
{'error': [{'message': "'@search.score' is not a valid property name. Property names in Weaviate are restricted to valid GraphQL names, which must be “/[_A-Za-z][_0-9A-Za-z]*/”., no such prop with name '@search.score' found in class 'LangChain_df32d6b6d10c4bb895db75f88aaabd75' in the schema. Check your schema files for which properties in this class are available"}]}

我的代码是这样的:

@timer
def from_documentsWeaviate(docs, embeddings):
     return Weaviate.from_documents(docs, embeddings, weaviate_url=WEAVIATE_URL, by_text=False)

  memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
    embeddings = OpenAIEmbeddings(deployment=OPENAI_EMBEDDING_DEPLOYMENT_NAME, model=OPENAI_EMBEDDING_MODEL_NAME, chunk_size=1)
    user_input = get_text()   
    retriever = AzureCognitiveSearchRetriever(content_key="content")

    
   
    
    llm = AzureChatOpenAI(
        openai_api_base=OPENAI_DEPLOYMENT_ENDPOINT,
        openai_api_version=OPENAI_API_VERSION ,
        deployment_name=OPENAI_DEPLOYMENT_NAME,
        openai_api_key=OPENAI_API_KEY,
        openai_api_type = OPENAI_API_TYPE ,
        model_name=OPENAI_MODEL_NAME,
        temperature=0)
    
    docs = get_relevant_documents(retriever, user_input)
    #vectorstore  = from_documentsChromaDb(docs=docs, embedding=embeddings)
    vectorstore  = from_documentsWeaviate(docs, embeddings)

我想知道是否应该首先索引表中的所有行并避免认知搜索部分。？

最佳答案

but then I get very weird errors like:

该错误意味着您的属性名称无效，例如@search.score 无效，因为它不符合此正则表达式:

/[_A-Za-z][_0-9A-Za-z]*/

I wonder if I should first index all rows from the table and avoid thecognitive search part.?

在我看来，Azure 认知搜索部分在此用例中有些过大，应替换为从 Azure SQL 获取行、将其组合到单个字段中并上传的管道。

关于python - Weaviate 与 Azure 认知搜索相结合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/76521370/

30

4

0

文章推荐： gradle - 确定gradle依赖的用法

文章推荐： Youtube API : Get videos from autogenerated channels (like Music)

文章推荐： azure - Azure 函数的最大实例数

haskell - 将测试覆盖率与 hpc 相结合
我发现 hpc 真的很令人困惑，即使在阅读了一些解释并玩了很多之后。我有一个图书馆 HML , 和两个测试套件 fileio-test和 types-test , 使用 HTF (我打算搬到 tas
.net - 如何将可设计组件与依赖注入(inject)相结合
创建可设计的 .NET 组件时，您需要提供默认构造函数。来自 IComponent文档: To be a component, a class must implement the IComponen
elasticsearch - 将日志条目与 logstash 相结合
我想从 dnsmasq 收集和处理日志，我决定使用 ELK。 Dnsmasq 用作 DHCP 服务器和 DNS 解析器，因此它为这两种服务创建日志条目。我的目标是向 Elasticsearch 发送
java - 与具有无限循环的线程(可调用)相结合
我定义了一个名为“folderwatcher”的类(可调用)，它正在监视特定文件夹的任何更改。主要代码处于无限循环中，类似于: Monitor a Directory for Changes usin
r - 如何将马赛克图与 xyplot 相结合？
我正在尝试重现 this plot : 它看起来像库格子中的 xyplot，但我找不到将马赛克图与 xyplot 组合的方法。有人知道怎么做吗？最佳答案你只是在寻找内置于 vcd:::cotab
c# - 将任务与反射(reflection)相结合
我遇到了提供字符串列表的情况。列表中的第一个条目是方法的名称。列表中的其余字符串是方法参数。我想使用任务来运行该方法(出于教育目的)。我在找出允许我将方法名称输入任务指令的正确过程时遇到问题。对于这
java - 有没有办法将流式数据检索与 hibernate 相结合？
为了处理非常大的集合(对于非常大，我的意思是“可能会抛出 OutOfMemory 异常”)，使用 Hibernate 似乎有问题，因为通常集合检索是在一个 block 中完成的，即 List valu
Postgresql:将相似性与 tsvector 相结合
我得到了一个包含超过 5000 万条记录的数据库表我需要尽快进行全文搜索。在一个较小的表上，我只是在文本列上有一个索引，我使用相似性函数来获得相似的结果。我还能够根据 similarity() 的结
sql - 将交叉表功能与 DISTINCT ON 相结合
我有两个表details 和data 表。我已经加入了两个表并且交叉表功能已经完成。我只想显示每个 serial 的最新数据。请参阅下面的当前和所需输出。问题:如何在此交叉表查询中使用 DISTI
sql - 将连接与 ORDER BY 相结合
我在 Postgre (9.1.9) 中将串联与排序结合起来时遇到了麻烦。比方说，我有一个包含 3 个字段的表格边框: Table "borders" Column
javascript - 将过滤功能与 map 相结合
我有一个组件，它使用辅助函数来获取日期列表，然后映射它们。在检索到的数据中，并不总是存在给定阶段的日期，因此我添加了逻辑，以便在该特定日期未定义时返回空字符串。辅助函数获取属性 Phase =“阶段
css - 窗口宽背景与宽度受限的 div 相结合
我想尝试构建一段干净、漂亮的代码，我可以在其中实现您在下图中看到的结果。在 Firefox、Chrome 或 Safari 中可以，但在 IE 中不行。我创建了一个 JSFiddle用代码。基本上
html - 将动态导航菜单与下拉 block 相结合
我有一个导航菜单，其中的元素旋转 90 度。我想将其与悬停在导航项上时显示的下拉 block 结合起来，以保持项的动态行为。动态导航面板的关键CSS代码在这里: .buttons-wrapper {
css - 将嵌套选择与 SASS 相结合
在 CSS 中，我可以像这样进行选择: input[type="number"], input[type="password"], input[type="text"], textarea, .but
c# - 将原生移动开发与 Xamarin 相结合
假设我们已经为不同的平台(iOS/Android/Winfon( future ))实现了移动应用程序。所有应用程序都有一些共同的业务逻辑。例如，计算器应用程序:用户输入两位数，我们的应用程序应该能
android - 将自定义标题与 FEATURE_PROGRESS 相结合
在我的 onCreate() 中，我设置了一个进度条，如下所示: getWindow().requestFeature(Window.FEATURE_PROGRESS); getWindow().se
c# - 将服务器端和客户端身份验证与 WebAPI 相结合
我有一个遗留的 ASP.NET webforms 应用程序，用户通过在服务器端处理的表单登录。如果输入的用户名 + 密码与数据库中的凭据匹配，我会在 session 中设置一些值(例如，当前用户 ID
python - 将相关资源与 TastyPie 相结合
如何在 TastyPie 中组合多个资源？我有 3 个模型要合并:用户、个人资料和帖子。理想情况下，我希望配置文件嵌套在用户中。我想从 UserPostResource 公开用户和所有个人资料位置。
c++ - 如何将单元测试与 assert() 相结合
假设使用assert() 检查对象函数的先决条件。那么，我该如何编写有意义的单元测试，以便在我将无效参数传递给函数时捕获前提条件失败？我的意思是，assert() 将 abort()，那么在那之后我
c++ - 将外部事件循环与 Qt 相结合
我正在为开源客户端/服务器 4X 策略游戏 Thousand Parsec 构建 Qt 客户端.这是一个 Google Summer of Code 项目。然而，我陷入了死胡同。基本上，客户端通过促进

首页

博学

6Ren·AI

商城

python - Weaviate 与 Azure 认知搜索相结合