gpt4 book ai didi

elasticsearch - Elasticsearch 模糊查询奇怪的结果

转载 作者:行者123 更新时间:2023-11-29 02:57:05 26 4
gpt4 key购买 nike

我使用 Elastic Search 大约一个月了,我发现了一件我无法理解的模糊查询。

场景是我有一组用户的类型和索引将近 10.000 个项目,我想搜索用户名,并以模糊模式返回与搜索字符串匹配的所有项目,例如我的用户是“masterviana” 如果我仅使用文本“mastervi”进行搜索,我希望使用模糊查询在结果顶部看到 masterviana,对吧?

"fuzzy" : {
"public_name" : {
"value" : "mastervi",
"boost" : 1.0,
"fuzziness" : 2,
"prefix_length" : 0,
"max_expansions": 100
}
}

但是我没有在第一页看到我的用户名 (masterviana),而且我看到的用户名与我的查询字符串“不太相似”,我将只显示前 5 个匹配项,因为没有扩展到太多发布

 {
"_index": "username",
"_type": "username",
"_id": "2061|FZ4y1t042482S3EqobiVllmv00",
"_score": 9.198499,
"_source": {
"public_name": "masterv",
"bbid": "FZ4y1t042482S3EqobiVllmv00",
"hash": 2061,
"avata": "http://goo.gl/4CRt3v"
}
},
{
"_index": "username",
"_type": "username",
"_id": "2048|r0I5XZ31076phruMS1gu9Hjv00",
"_score": 5.9688096,
"_source": {
"public_name": "project--master",
"bbid": "r0I5XZ31076phruMS1gu9Hjv00",
"hash": 2048,
"avata": "http://goo.gl/4CRt3vr"
}
},
{
"_index": "username",
"_type": "username",
"_id": "1980|W5Wal166832UV5oCqUH9Vjcv00",
"_score": 5.7984095,
"_source": {
"public_name": "masterjv",
"bbid": "W5Wal166832UV5oCqUH9Vjcv00",
"hash": 1980,
"avata": "http://goo.gl/4CRt3v"
}
},
{
"_index": "username",
"_type": "username",
"_id": "2108|Kufhm899338GPWHsuoei1HOv00",
"_score": 5.7984095,
"_source": {
"public_name": "master25",
"bbid": "Kufhm899338GPWHsuoei1HOv00",
"hash": 2108,
"avata": "http://goo.gl/4CRt3v"
}
},
{
"_index": "username",
"_type": "username",
"_id": "1952|AtPw2a97575sC5JT406msOXv00",
"_score": 5.7984095,
"_source": {
"public_name": "masterpiz",
"bbid": "AtPw2a97575sC5JT406msOXv00",
"hash": 1952,
"avata": "http://goo.gl/4CRt3v"
}
},

如您所见,我排在前列 1.masterv 2.project-master 我认为我的查询“mastervi”更接近于“masterviana”,例如“masterv”或“project-master”

还有一件事,如果我使用完全相同的文本“masterviana”进行搜索,我只会得到这个项目

最佳答案

排名是编辑距离和(通常无益)术语的稀有程度的混合。我不确定在这种情况下应该归咎于哪一个,但术语稀缺排名是一个长期存在的 Lucene 问题。在 elasticsearch 中有一个使用 FuzzyLikeThisQuery 的解决方法,但它可能不会存在更长时间,因此这加速了修复 Lucene 的需要(请参阅此处了解背景 https://github.com/elastic/elasticsearch/pull/10391)

关于elasticsearch - Elasticsearch 模糊查询奇怪的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29653571/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com