gpt4 book ai didi

mongodb - 如何使用 MongoDB 从聚合结果中投影附加数据?

转载 作者:可可西里 更新时间:2023-11-01 10:00:34 25 4
gpt4 key购买 nike

我正在学习 MongoDB 并尝试对集合进行分组。我正在寻找的是按年份分组,获取最大的“平均注释”字段并显示与该平均值相关的文档的字段主要名称

例如,如果我有:

Name    | Average   | Year
Name_01 | 7.56 | 1995
Name_02 | 8.96 | 1995
Name_03 | 3.25 | 2005
Name_04 | 4.36 | 2005
Name_05 | 7.52 | 2020

我需要:

Name    | Average   | Year
Name_02 | 8.96 | 1995
Name_05 | 7.52 | 2020
Name_04 | 4.36 | 2005

我已经完成了组和最大。这是我的代码:

db.foobar.aggregate([
{
$group: { _id: '$year_published', max: { $max: '$statistics.average' }}
},
{
$project: { _id: 1, max: 1 }
},
{
$sort: { max: -1 }
}
])

这给了我这样的结果:

{
"result" : [
{
"_id" : 1999,
"max" : 8.0343000000000000
},
{
"_id" : 1985,
"max" : 7.8833299999999999
}
// An so on...
}

但我还想转换与“max”相关的文档的主要名称,以获得如下内容:

 {
"result" : [
{
"_id" : 1999,
"max" : 8.0343000000000000,
"name": "Foo Bar"
},
{
"_id" : 1985,
"max" : 7.8833299999999999,
"name": "Lorem Ipsum"
}
// An so on...
}

注意:问题的下一部分增加了名称的复杂性(因为我的文档结构)。这不是我现在主要关心的问题,但我将它添加到问题中以反射(reflect)我所有的问题。

主要名称有点难以获得。对于每个文档,我都有一个这样的对象数组:

{
"names" : [
{
"type" : "primary",
"value" : "Foo bar"
},
{
"type" : "alternate",
"value" : "Foo foo"
},
{
"type" : "alternate",
"value" : "Bar bar"
}
]
}

我想要得到的是具有“主要”类型的名称(即在我的示例中为“Foo bar”)。

这是我的文档结构:

{
"_id" : ObjectId("56338f2bdc99b8ec22a43328"),
"names" : [
{
"type" : "primary",
"value" : "Foo bar"
},
{
"type" : "alternate",
"value" : "Barr foo"
}
],
"year_published" : 1992
"statistics" : {
"average" : 6.6057699999999997
}
}

我想我还不算太远,但我不知道该怎么做......你能帮帮我吗?

最佳答案

如果您希望从具有“最大”值的特定文档中获取“配对”值,那么 $max 不适合您。相反,您需要做的是 $sort数据,然后使用 $first运营商。

db.foobar.aggregate([
{ "$sort": { "year_published": 1, "statistics.average": -1 } },
{ "$group": {
"_id": "$year_published",
"max": { "$first": "$statistics.average" }},
"name": {
"$first": {
"$setDifference": [
{ "$map": {
"input": "$names",
"as": "name",
"in": {
"$cond": {
"if": { "$eq": [ "$$name.type", "primary" ] },
"then": "$$name.value",
"else": false
}
}
}},
[false]
]
}
}
}},
{ "$unwind": "$name" }
])

$first$last 运算符作用于“分组边界”数据。这意味着它们从出现在用于分组 _id 的值的开头或结尾处的属性返回数据。

这就是为什么要先“排序”,这样文档才能按顺序进行选择。

相比之下,$max$min 只是从示例文档中的任意位置选取“最大/最小”值。当您想要的时候这很好,但是如果您想要“相关”字段,那么您必须首先排序。

这就是它的基础。处理过滤数组的另一部分最好用 $map 完成。和 $setDifference组合如图。 $map 允许通过 $cond 测试条件在每个数组元素“内联”上,并根据是真还是假返回值。结果当然仍然是一个等长的数组。

$setDifference 实质上过滤掉了返回为 false 的所有内容,因此唯一剩下的应该是“主要的”。仍然是一个数组,这就是为什么 $unwind 仍然被使用的原因,尽管它只是一个单元素数组。

future 的 MongoDB 版本将通过 $filter$arrayElemAt 更好地完成这项工作。这是一瞥:

db.foobar.aggregate([
{ "$sort": { "year_published": 1, "statistics.average": -1 } },
{ "$group": {
"_id": "$year_published",
"max": { "$first": "$statistics.average" }},
"name": {
"$first": {
"$arrayElemAt": [
{ "$filter": {
"input": "$names",
"as": "name",
"cond": {
"$eq": [ "$$name.type", "primary" ]
}
}},
0
]
}
}
}}
])

但这一切都没有改变“先排序”的基本规则,然后才从分组边界中选取值。

关于mongodb - 如何使用 MongoDB 从聚合结果中投影附加数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33495346/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com