gpt4 book ai didi

azure - 使用 Azure 认知服务提取超链接以及相关文本

转载 作者:行者123 更新时间:2023-12-03 02:00:37 24 4
gpt4 key购买 nike

我们有一个要求,我们需要搜索文档并提供相关文本以及文档中存在的超链接。使用 azure 搜索,我们能够获取文本,但无法获取与该文本关联的超链接。

根据下面的示例,在使用 Azure 认知服务时,是否有办法获取与文本关联的超链接 ( https://stackoverflow.com )?我们需要搜索文档并返回相关文本以及文档中存在的超链接。

例如
这是我们文档中的一段文字 indexed使用 azure 搜索。

azure 搜索的输出:
这是我们使用 azure 搜索索引的文档中的文本。

看到了文本分析 API,但我没有找到任何与超链接提取以及文本相关的内容。

最佳答案

仔细阅读您的问题,我假设您正在尝试使用 azure 搜索索引器来索引 html 文档,并且索引器仅从 html 中提取人类可读的文本?

您可以通过更改 "parsingMode" configuration 来控制从 Blob 中提取哪些数据。在索引器上。默认值“default”将删除所有 html 标记。如果将该值更改为“text”,您可以索引完整的 html(包括 anchor href 等标记元素属性)。

我不相信有任何方法可以配置 azure 搜索索引器来删除除超链接之外的所有 html 标记。如果您的场景需要像这样更复杂的解析,您需要自己完成。也许通过 custom skill如果您仍然想利用索引器管道的其余部分

关于azure - 使用 Azure 认知服务提取超链接以及相关文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76198335/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com