gpt4 book ai didi

elasticsearch - 从每条Elasticsearch route 获取第一个文档

转载 作者:行者123 更新时间:2023-12-02 23:00:42 25 4
gpt4 key购买 nike

我有一个带天路由键的Elasticsearch索引,格式为"yyyyMMdd"。每天都会添加许多新文档。在本月底,我想查询是否有某天由于某种原因没有添加源文件。有一个source_id字段表示源。

到目前为止,我需要给出所有路由键,例如2016010120160102等,并按source_id进行过滤。但是,这可能会返回成百上千的文档,我可能需要对它们全部进行分页。

有没有办法只知道是否有一个路由键没有与给定的source_id匹配的文档,所以从本质上来说,我只会将31个文档或更少的文档返回给我的应用程序代码,因此遍历并检查很容易如果一天没有文件。

有任何想法吗?

最佳答案

您可以在 Terms Aggregation 字段上使用 _routing 来知道使用了所有路由值。请参阅下面的查询:

POST <index>/<type>/_search
{
"size": 0,
"query": {
"term": {
"source_id": {
"value": "VALUE" <-- Value of source_id to filter on
}
}
},
"aggs": {
"routings": {
"terms": {
"field": "_routing",
"size": 31 <-- We don't expect to get more than 31 unique _routing values
}
}
}
}

相应的Nest代码如下:
var response = client.Search<object>(s => s
.Index("<index name>")
.Type("<type>")
.Query(q => q
.Term("source_id", "<source value>"))
.Aggregations(a => a
.Terms("routings", t => t
.Field("_routing")
.Size(31))));

var routings = response.Aggs.Terms("routings").Items.Select(b => b.Key);
routings将包含您需要的路由值列表。

关于elasticsearch - 从每条Elasticsearch route 获取第一个文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34796645/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com