gpt4 book ai didi

elasticsearch - ES在特定情况下,此字段下方的字段如何匹配&不删除 token ?

转载 作者:行者123 更新时间:2023-12-03 02:23:32 27 4
gpt4 key购买 nike

我有下面的映射。

"sub":{"type":"text", "analyzer":"stop_analyzer"}

我有一个查询
{
"_source":["sub"],
"query": {
"fuzzy" : { "sub" : "Thr" }
}
}

分析仪:
{
"analysis": {
"analyzer":{
"stop_analyzer":{
"tokenizer":"lowercase",
"filter":["synonym_graph","stop_el_filter"]
}
},
"filter": {
"stop_el_filter": {
"type": "stop",
"stopwords": "_english_"
},
"synonym_graph" : {
"type" : "synonym_graph",
"lenient": true,
"synonyms" : [
"americas, us, usa, u.s.a, america => america",
"americas-us public sector, america ps, ps america, ps usa => ps"
]
}
}
}
}

以下字符串如何匹配:

(USER_TRIGGERED(ALL:MAINT = 8小时节点02-A / B的ARL))

Analyze API提供以下 token :
 "token": "user"
"token": "triggered"
"token": "all"
"token": "maint",
"token": "hr"
"token": "arl"
"token": "nodes"
"token": "b"

为什么 Thr与此文档匹配?当我分析 Thr时,结果为 thr

是因为模糊删除 t来匹配 hr吗? -是的,我认为我是对的。



有什么方法不从 A中删除该 A/B-在特殊情况下不视为停用词[在 A不带空格的情况下不标记)?

最佳答案

Thr与您的文档匹配,因为fuzzy查询允许该单词长度上1个字符的距离。因此,fuzzy(Thr)hr token 匹配。

关于第二个问题,A被删除,因为它是英语停用词,并且您正在使用stop token 过滤器。因此,如果删除它,A也将被索引

关于elasticsearch - ES在特定情况下,此字段下方的字段如何匹配&不删除 token ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61750855/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com