gpt4 book ai didi

elasticsearch - 在 Elasticsearch 中按数组元素匹配

转载 作者:行者123 更新时间:2023-11-29 02:55:41 33 4
gpt4 key购买 nike

我必须在 Elasticsearch 中构建一个非常重要的(现在看来)查询。假设我有几个实体,每个实体都有一个由字符串组成的数组元素:

1). ['A', 'B']
2). ['A', 'C']
3). ['A', 'E']
4). ['A']

数组元素的映射如下(使用动态模板):

{
"my_array_of_strings": {
"path_match": "stringArray*",
"mapping": {
"type": "string",
"index": "not_analyzed"
}
}
}

实体的 Json 表示如下所示:

{
"stringArray": [
"A",
"B"
]
}

然后我有用户输入: ['A', 'B', 'C'].

我想要实现的是找到仅包含输入中指定元素的实体 - 预期结果是:['A', 'B'], ['A', 'C'], ['A'] 但不是 ['A', 'E'](因为用户输入中不存在 'E')。

这个场景可以用Elasticsearch实现吗?

更新:除了使用脚本的解决方案——它应该工作得很好,但很可能会大大减慢查询速度,以防有许多匹配的记录——我还设计了另一个。下面我将尝试阐述它的主要思想,没有代码实现。

我没有提到的一个重要条件(这可能给了其他用户有值(value)的提示)是数组由枚举元素组成,即数组中此类元素的数量是有限的。这允许将此类数组展平为实体的单独字段。

假设有 5 个可能的值:'A'、'B'、'C'、'D'、'E'。这些值中的每一个都是一个 bool 字段 - 如果它为空(即数组版本将包含此元素)则为真,否则为假。然后每个实体都可以重写如下:

1).
A = true
B = true
C = false
D = false
E = false

2).
A = true
B = false
C = true
D = false
E = false

3).
A = true
B = false
C = false
D = false
E = true

4).
A = true
B = false
C = false
D = false
E = false

有了 ['A', 'B', 'C'] 的用户输入,我需要做的就是:a) 获取所有可能的值(['A'、'B'、'C'、'D'、'E'])并从中减去用户输入 -> 结果将是 ['D ', 'E'];b) 查找每个结果元素均为假的记录,即“D = false AND E = false”。

如预期的那样,这将给出记录 1、2 和 4。我仍在试验这种方法的代码实现,但到目前为止它看起来很有希望。它尚未经过测试,但我认为这可能比在查询中使用脚本执行得更快,并且对资源的需求更少。

为了进一步优化这一点,可能根本不提供将是“假”的字段,并将先前的查询修改为“D = 不存在且 E = 不存在”- 结果应该是一样。

最佳答案

您可以使用 scripting 实现此目的, 这是它的样子

{
"query": {
"filtered": {
"filter": {
"bool": {
"must": [
{
"terms": {
"name": [
"A",
"B",
"C"
]
}
},
{
"script": {
"script": "if(user_input.containsAll(doc['name'].values)){return true;}",
"params": {
"user_input": [
"A",
"B",
"C"
]
}
}
}
]
}
}
}
}
}

这个 groovy 脚本 正在检查列表是否包含除 ['A', 'B', 'C'] 之外的任何内容,如果包含则返回 false,所以它不会返回 ['A', 'E']。它只是检查 sublist 匹配。此脚本可能需要几秒钟。您需要启用动态脚本ES 2.x 的语法也可能不同,如果它不起作用请告诉我。

编辑 1

我只将这两个条件放在 filter 中。首先仅返回那些具有 A、B 或 C 的文档,然后仅在这些文档上应用脚本,因此这会比前一个更快。更多关于 filter ordering

希望这对您有所帮助!

关于elasticsearch - 在 Elasticsearch 中按数组元素匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34874713/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com