gpt4 book ai didi

performance - Elasticsearch使用IN查询和评分会降低结果

转载 作者:行者123 更新时间:2023-12-02 22:30:24 25 4
gpt4 key购买 nike

我将文本文档数据(大约500k)保存在elasticsearch中,其中文档文本与其对应的文档编号对应。

我正在尝试批量获取“示例文本”的结果,尤其是带有评分的一组特殊的文档编号(大约300k),并且我正面临着极其缓慢的结果。

这是映射

PUT my_index
{
"mappings" : {
"doc_repo" : {
"properties" : {
"doc_number" : {
"type" : "integer"
},
"document" : {
"type" : "string",
"term_vector" : "with_positions_offsets_payloads"
}
}
}
}
}

这是请求查询
{
"query" : {
"bool" : {
"must" : [
{
"terms" : {
"document" : [
"sample text"
]
}
},
{
"terms" : {
"doc_number" : [1,2,3....,300K] //ArrayOf_300K_DocNumbers
}
}
]
}
},
"fields" : [
"doc_number"
],
"size" : 500,
"from" : 0
}

我尝试以其他两种方式获取结果
  • 不计入特定文档编号集的结果(我为此使用了过滤)
  • 得分但没有任何特定的文档编号(分批)的结果

  • 两者都很快速,但是当我尝试同时实现两者时,问题就来了。

    我是否需要更改映射或搜索查询或任何其他方式来实现此目的。

    提前致谢。

    最佳答案

    问题特别是针对elasticsearch 2.X,升级elasticsearch可解决该问题。

    关于performance - Elasticsearch使用IN查询和评分会降低结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42557369/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com