gpt4 book ai didi

mongodb - 如何使用 group by 聚合并正确排序

转载 作者:可可西里 更新时间:2023-11-01 10:00:54 28 4
gpt4 key购买 nike

我正在使用 Mongodb。考虑我的下一个文档:

{ uid: 1, created: ISODate("2014-05-02..."), another_col : "x" },
{ uid: 1, created: ISODate("2014-05-05..."), another_col : "y" },
{ uid: 2, created: ISODate("2014-05-10..."), another_col : "z" },
{ uid: 3, created: ISODate("2014-05-05..."), another_col : "w" },
{ uid: 1, created: ISODate("2014-05-01..."), another_col : "f" },
{ uid: 2, created: ISODate("2014-05-22..."), another_col : "a" }

我想做的是对 uid 进行简单的 groupby 并按降序对创建的内容进行排序,这样我就可以获得每个 uid 的第一行。

预期输出的示例

{ uid: 1, created: ISODate("2014-05-05..."), another_col: "y" },
{ uid: 2, created: ISODate("2014-05-22..."), another_col: "a" },
{ uid: 3, created: ISODate("2014-05-05..."), another_col: "w" }

我能得到的最好的是:

db.mycollection.aggregate( {$group: {_id: "$uid", rows: {$push: { "created" : "$created" }}}}, sort { // doesnt work well }  )

任何人都可以指导我如何正确组合分组依据和排序?它只是没有像我预期的那样工作。(注意:我检查了很多线程,但我找不到适合我的情况的正确答案)

最佳答案

这里有一些问题需要理解。

当您使用 $group 时边界将按照它们被发现的顺序排序,没有初始或结束阶段 $sort手术。因此,如果您的文件最初是这样排列的:

{ uid: 1, created: ISODate("2014-05-02..."), another_col : "x" },
{ uid: 1, created: ISODate("2014-05-05..."), another_col : "y" },
{ uid: 3, created: ISODate("2014-05-05..."), another_col : "w" },
{ uid: 2, created: ISODate("2014-05-10..."), another_col : "z" },

然后只需使用 $group没有 $sort在管道的末端会返回这样的结果:

{ uid: 1, created: ISODate("2014-05-05..."), another_col : "y" },
{ uid: 3, created: ISODate("2014-05-05..."), another_col : "w" },
{ uid: 2, created: ISODate("2014-05-10..."), another_col : "z" },

这是一个概念,但实际上您所期望的结果似乎需要按 uid 的排序顺序返回“最后其他字段”,这就是您要查找的内容。在这种情况下,获得结果的方法实际上是首先进行 $sort,然后使用 $last运算符(operator):

db.mycollection.aggregate([

// Sorts everything first by _id and created
{ "$sort": { "_id": 1, "created": 1 } },

// Group with the $last results from each boundary
{ "$group": {
"_id": "$uid",
"created": { "$last": "$created" },
"another_col": { "$last": "$created" }
}}
])

或者基本上将排序应用于您想要的内容。

$last之间的区别和 $max是后者将为分组 _id 中的给定字段选择“最高”值,而不管当前按未排序的顺序排序。另一方面,$last将选择与“最后”分组 _id 值出现在同一“行”中的值。


如果您实际上想要对数组的值进行排序,那么方法是相似的。将数组成员保持在“创建”顺序中,您也将首先排序:

db.mycollection.aggregate([

// Sorts everything first by _id and created
{ "$sort": { "_id": 1, "created": 1 } },

// Group with the $last results from each boundary
{ "$group": {
"_id": "$uid",
"row": {
"$push": {
"created": "$created",
"another_col": "$another_col"
}
}
}}
])

并且具有这些字段的文档将按照它们已经排序的顺序添加到数组中。

关于mongodb - 如何使用 group by 聚合并正确排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23899409/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com