gpt4 book ai didi

azure - 搜索带下划线的术语不会返回预期结果

转载 作者:行者123 更新时间:2023-12-04 16:10:11 27 4
gpt4 key购买 nike

如何通过 Army* 词搜索名为“Hola-Mundo_Army.jpg”的文档(请始终在末尾使用星号键)?问题是,如果我使用 Army* 搜索文档,结果为零。我认为问题出在 Army 一词之前的下划线。

但是如果我搜索 Mundo_Army*,结果是正确找到的。

docs?api-version=2016-09-01&search=Mundo_Army* <--- 1 个结果正常docs?api-version=2016-09-01&search=Army* <--- 0 个结果,它应该找到 1 个结果,就像之前的搜索一样。我总是需要在末尾使用星号。

谢谢!

这是我必须搜索和查找的 blob 信息:

{
"@search.score": 1,
"content": "{\"azure_cdn\":\"http:\\/\\/dev-dr-documents.azureedge.net\\/localhost-hugo-docs-not-indexed\\/Hola-Mundo_Army.jpg\"}\n",
"source": "dr",
"title": "Hola-Mundo_Army.jpg",
"file_name": "Hola-Mundo_Army.jpg",
"file_type": "Image",
"year_created": "2017",
"client": "LALALA",
"brand": "LELELE",
"description": "HUGO_DEV-TUCUMAN",
"categories": "Clothing and Accessories",
"media": "Online media",
"tags": null,
"channel": "Case Study",
"azuresearch_skipcontent": "1",
"id": "1683",
"metadata_storage_content_type": "application/octet-stream",
"metadata_storage_size": 109,
"metadata_storage_last_modified": "2017-04-26T18:30:35Z",
"metadata_storage_content_md5": "o2yZWelvS/EAukoOhCuuKg==",
"metadata_storage_name": "Hola-Mundo_Army.json",
"metadata_content_encoding": "ISO-8859-1",
"metadata_content_type": "text/plain; charset=ISO-8859-1",
"metadata_language": "en"
}

最佳答案

解决此类问题的最佳方法是使用 Analyze API 。它将帮助您了解搜索引擎如何处理您的文档和查询词。在您的情况下,假设您没有在要搜索的字段上设置分析器属性,则文本 Hola-Mundo_Army.jpg 会被默认分析器分解为以下两个术语: Hola、mundo_army.jpg。这些是索引中的术语。这就是为什么当您搜索前缀 mundo_army* 时,会匹配术语 mundo_army.jpg。前缀 army* 与索引中的任何内容都不匹配。

您可以从本文中了解有关搜索引擎的默认行为以及如何自定义它的更多信息:How full text search works in Azure Search

关于azure - 搜索带下划线的术语不会返回预期结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43661160/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com