gpt4 book ai didi

elasticsearch - Elasticsearch 中的组合非嵌套和嵌套查询

转载 作者:行者123 更新时间:2023-11-29 02:43:41 26 4
gpt4 key购买 nike

我想使用 ES 进行图书搜索。所以我决定将作者姓名和标题(作为嵌套文档)放入索引中,如下所示:

curl -XPUT localhost:9200/library/search_books/1 -d'{
"author": "one",
"books": [
{
"title": "two",
},
{
"title": "three",
}
]
}'

我没有得到的是:我需要如何构建搜索查询以在搜索“一二”时只找到第二本书,在搜索“二三”时什么也找不到,在搜索“一”时找不到所有书?

最佳答案

也许是这样的?

{
"query":{
"bool":{
"must":[
{
"term":{
"author":"one"
}
},
{
"nested":{
"path":"books",
"query":{
"term":{
"books.title":"two"
}
}
}
}
]
}
}
}

该查询基本上是说文档必须有 author: onebooks.title: two。您可以轻松地重新配置该查询。例如,如果您只想搜索作者,请删除嵌套部分。如果你想要一本不同的书,改变嵌套等等。

这假设您使用的是实际的 Nested documents ,而不是内部对象。对于内部对象,您可以只使用完全限定路径而无需特殊的嵌套查询。

Edit1:您或许可以在索引时通过巧妙的提升来实现这一点,尽管这只是一个近似的解决方案。如果“author”被大量提升,它将比仅匹配标题的匹配排序更高,即使标题匹配查询的两个部分。然后,您可以使用 min_score 截止值来防止显示这些内容。

这只是一个松散的近似值,因为有些可能会悄悄通过。它也可能对“正确”匹配之间的一般排序做出奇怪的事情。

Edit2:使用 query_string 更新以公开“单一输入”选项:


{
"query":{
"query_string" : {
"query" : "+author:one +books.title:two"
}
}
}

假设您使用默认的“内部对象”。如果你有真正的嵌套类型,query_string 会变得非常非常复杂:


{
"query":{
"query_string" : {
"query" : "+author:one +BlockJoinQuery (filtered(books.title:two)->cache(_type:__books))"
}
}
}

重要免责声明 我没有测试这两个查询字符串中的任何一个,因此它们可能不完全正确。但它们表明 Lucene 语法并不过分友好。


Edit3 - 这是我最好的主意:

考虑之后,您最好的解决方案可能是索引一个连接作者和书名的特殊字段。像这样:

{
"author": "one",
"books": [
{
"title": "two",
},
{
"title": "three",
}
],
"author_book": [ "one two", "one three" ]
}

然后在搜索时,您可以在 author_book 上进行精确的术语匹配:

{
"query" : {
"term" : {
"author_book" : "one two"
}
}
}

关于elasticsearch - Elasticsearch 中的组合非嵌套和嵌套查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15577474/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com