gpt4 book ai didi

elasticsearch - 我可以知道 "more like this"查询的选定术语吗

转载 作者:行者123 更新时间:2023-12-04 05:50:51 28 4
gpt4 key购买 nike

我正在尝试微调“更像这样”查询,使其适用于非常相似的文档(正式公告,大部分文本都是"template",因此只有某些段落很重要)。

所以我想知道,给定一个选定的文档,对于我的“max_query_terms”:20,选择哪些术语,使用解释的查询仅显示其中哪些确实在检索到的文档中找到,而不是整个集合二十个代币。

我知道这组术语是先将引用文档与索引进行比较而选择的,以构建唯一的“匹配”查询,但是...当我浏览解释的命中时,我有超过 20 个标记...

例如,如果我使用 ngram,则 max_query_terms 适用于分析文本的标记?或者分析之前的术语,即采用 20 个单词,然后将我的过滤器(停用词、省略、ngram 等)应用于此集合?

有没有办法通过rest或者api来检索mlt算法生成的匹配查询?

最佳答案

您必须将 validateexplain 结合使用,才能了解 Elastic 选择了哪些术语。

GET /imdb/movies/_validate/query?explain=true
{
"query": {
"more_like_this": {
"like": {
"_id": "88247"
}
}
}
}

回应:

{
...
"explanations": [
{
"index": "imdb",
"valid": true,
"explanation": "filtered((((title:terminator^3.71334 plot:kyle^1.0604408 plot:cyborg^1.0863208 ... )~2)) -ConstantScore(_uid:movies#88247))->cache(_type:movies)"
}
]
}

请参阅此discussion还有这个pull request了解更多详情。

关于elasticsearch - 我可以知道 "more like this"查询的选定术语吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38441552/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com