gpt4 book ai didi

azure-cognitive-search - 使用 Azure 搜索为 Azure 数据库中的 HTML 内容编制索引

转载 作者:行者123 更新时间:2023-12-05 07:45:27 25 4
gpt4 key购买 nike

我们将一些 CMS 内容存储在我们的 Azure 数据库中,并且需要从我们的数据库中索引一些 HTML 内容。

在 Azure 搜索中对此进行索引的最佳做法是什么,以便它只索引内容,而不是 HTML?或者,索引识别为 HTML,并忽略 HTML 标记?

我知道一个选择是在它到达索引之前或在它到达索引的途中对其进行操作,但我希望 Azure 搜索中有一些内置功能。<​​/p>

最佳答案

目前,Azure blob indexer是唯一支持以剥离 HTML 标记的方式解析 HTML 的 Azure 搜索索引器。 Azure SQL 索引器将 HTML 文本视为一大块文本。

您有几个可能的选择:

  1. 使用 SQL 索引器并接受被索引的 HTML 标记 - 根据您的文档,您的搜索质量可能仍然不错。
  2. 预处理您的数据并去除 HTML 标记,然后将解析后的文本放回 SQL(并使用 SQL 索引器),或者使用索引 API 将数据推送到搜索索引中。
  3. 将 HTML 数据存储在 blob 存储中,并使用 blob 索引器为 HTML 数据编制索引,同时继续使用 SQL 索引器为其余数据编制索引。多个索引器可以写入同一个搜索索引,实际上是“组装”来自多个数据源的文档。

关于azure-cognitive-search - 使用 Azure 搜索为 Azure 数据库中的 HTML 内容编制索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41616430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com