gpt4 book ai didi

Azure-搜索,部分单词搜索不起作用

转载 作者:行者123 更新时间:2023-12-02 06:33:07 25 4
gpt4 key购买 nike

搜索短语的部分部分会以奇怪的顺序返回结果,例如,给出这两个文档

{
"@search.score": 0.5696786,
"Guid": "ce73ca06-f170-46df-b0ef-a6e6e72b76ce",
"FirstName": "Ruy",
"LastName": "Bssaf",
"Phone": "560523791699",
"CustomerId": "-1",
"CustomerEmail": "guy@twingocoil",
"MySuperpharm": "True"
},
{
"@search.score": 0.5619051,
"Guid": "090c623f-5993-458e-93cc-8ef3d885eb29",
"FirstName": "ruy",
"LastName": "reffen",
"Phone": "0522545833",
"CustomerId": "76016443160",
"CustomerEmail": "guy@geffenmedicalcom",
"MySuperpharm": "False"
},

搜索“guy@twingoco”将在第一个文档之前返回第二个文档,尽管显然人们希望首先看到第一个文档,其中的“CustomerEmail”字段几乎与短语术语相同。

搜索在门户内完成,除了搜索词之外没有额外的参数。搜索完整电子邮件时,预期结果确实是第一位的。

请不要引用“电子邮件短语”的这种具体情况,我一般是问如何使搜索也考虑部分短语。

最佳答案

此问题与 Lucene 处理电子邮件地址的方式有关。 Azure 搜索使用 Lucene 分析器作为其默认分析器:https://lucene.apache.org/core/5_2_0/core/org/apache/lucene/analysis/Analyzer.html

标准 Lucene 分析器将电子邮件视为单个标记,这就是部分搜索不会为您创建命中的原因。 (类似于,如果您搜索“汽车”,即使它是前缀,您也不会搜索到“小心”)。有关此问题的更多解释如下:Querying email addresses indexed by lucene

好消息是,您可以创建一个自定义托坎转换器来帮助您解决此问题:检查已接受的答案 Using Lucene to search for email addresses查看如何实现此类标记生成器的方法,并查看 Azure 搜索的此文档以了解如何使用自定义分析器:https://azure.microsoft.com/en-gb/blog/custom-analyzers-in-azure-search

祝你好运!

关于Azure-搜索,部分单词搜索不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41414738/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com