gpt4 book ai didi

Elasticsearch 查询多个术语

转载 作者:行者123 更新时间:2023-12-02 23:12:01 25 4
gpt4 key购买 nike

我正在尝试创建一个允许按名称和类型进行搜索的搜索查询。我已经为这些值编制了索引,我在 Elasticsearch 中的记录如下所示:

{
_index: "assets",
_type: "asset",
_id: "eAOEN28BcFmQazI-nngR",
_score: 1,
_source: {
name: "test.png",
mediaType: "IMAGE",
meta: {
content-type: "image/png",
width: 3348,
height: 1890,
},
createdAt: "2019-12-24T10:47:15.727Z",
updatedAt: "2019-12-24T10:47:15.727Z",
}
}

例如,我将如何创建一个查询来查找名称为“test”且为图像的所有 Assets ?

我尝试了 multi_mach 查询,但没有返回正确的结果:

{
"query": {
"multi_match" : {
"query": "*test* IMAGE",
"type": "cross_fields",
"fields": [ "name", "mediaType" ],
"operator": "and"
}
}
}

上面的查询返回 0 个结果,如果我将运算符更改为“或”,它会返回所有 IMAGE 类型的 Assets 。

如有任何建议,我们将不胜感激。 TIA!

编辑:添加映射下面是映射:

{
"assets": {
"aliases": {},
"mappings": {
"properties": {
"__v": {
"type": "long"
},
"createdAt": {
"type": "date"
},
"deleted": {
"type": "date"
},
"mediaType": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"meta": {
"properties": {
"content-type": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"width": {
"type": "long"
},
"height": {
"type": "long"
}
}
},
"name": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"originalName": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"updatedAt": {
"type": "date"
}
}
},
"settings": {
"index": {
"creation_date": "1575884312237",
"number_of_shards": "1",
"number_of_replicas": "1",
"uuid": "nSiAoIIwQJqXQRTyqw9CSA",
"version": {
"created": "7030099"
},
"provided_name": "assets"
}
}
}
}

最佳答案

对于这个简单的查询,您不需要使用通配符表达式。

首先,更改name 字段上的分析器。

您需要创建一个自定义分析器,将 . 替换为 space,因为默认的标准分析器不会这样做,因此您在搜索 test 你得到 test.png 因为倒排索引中会有 testpng这样做的主要好处是避免了非常昂贵的正则表达式查询

使用自定义分析器更新了映射,这将为您完成工作。只需更新您的映射并重新索引所有文档即可。

{
"aliases": {},
"mappings": {
"properties": {
"__v": {
"type": "long"
},
"createdAt": {
"type": "date"
},
"deleted": {
"type": "date"
},
"mediaType": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"meta": {
"properties": {
"content-type": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"width": {
"type": "long"
},
"height": {
"type": "long"
}
}
},
"name": {
"type": "text",
"analyzer" : "my_analyzer"
},
"originalName": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"updatedAt": {
"type": "date"
}
}
},
"settings": {
"analysis": {
"analyzer": {
"my_analyzer": {
"tokenizer": "standard",
"char_filter": [
"replace_dots"
]
}
},
"char_filter": {
"replace_dots": {
"type": "mapping",
"mappings": [
". => \\u0020"
]
}
}
},
"index": {
"number_of_shards": "1",
"number_of_replicas": "1"
}
}
}

其次,您应该将查询更改为 bool 查询,如下所示:

{
"query": {
"bool": {
"must": [
{
"match": {
"name": "test"
}
},
{
"match": {
"mediaType.keyword": "IMAGE"
}
}
]
}
}
}

使用 must with 2 match query 的意思是,只有 must query 的所有子句都匹配时才会返回 docs。

我已经通过创建索引、插入一些示例文档并查询它们来测试我的解决方案,如果您需要任何帮助,请告诉我。

关于Elasticsearch 查询多个术语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59468386/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com