gpt4 book ai didi

python - 如何在 pymongo 中使用 "group"对相似行进行分组?

转载 作者:太空狗 更新时间:2023-10-29 20:11:44 24 4
gpt4 key购买 nike

我是 mongodb/pymongo 的新手。我已经成功地将我的数据导入到 mongo 中,并且想使用 group 函数将相似的行分组在一起。例如,如果我的数据集如下所示:

data = [{uid: 1 , event: 'a' , time: 1} , 
{uid: 1 , event: 'b' , time: 2} ,
{uid: 2 , event: 'c' , time: 2} ,
{uid: 3 , event: 'd' , time: 4}
]

如何使用group函数将上述行按照uid字段进行分组,输出如下?

 { {uid: 1} : [{uid: 1 , event: 'a' , time: 1} , {uid: 1 , event: 'b' , time: 2} ],
{uid: 2} : [{uid: 2 , event: 'c' , time: 2} ],
{uid: 3} : [{uid: 3 , event: 'd' , time: 4} ] }

我通读了 http://www.mongodb.org/display/DOCS/Aggregation 中的示例.但是,在我看来,这些示例总是聚合成单个数字或对象。

谢谢,

最佳答案

您不需要使用 reduce 函数来实际减少任何东西。例如:

>>> coll.insert(dict(uid=1,event='a',time=1))
ObjectId('4d5b91d558839f06a8000000')
>>> coll.insert(dict(uid=1,event='b',time=2))
ObjectId('4d5b91e558839f06a8000001')
>>> coll.insert(dict(uid=2,event='c',time=2))
ObjectId('4d5b91f358839f06a8000002')
>>> coll.insert(dict(uid=3,event='d',time=4))
ObjectId('4d5b91fd58839f06a8000003')
>>> result = coll.group(['uid'], None,
{'list': []}, # initial
'function(obj, prev) {prev.list.push(obj)}') # reducer
>>> len(result) # will show three groups
3
>>> int(result[0]['uid'])
1
>>> result[0]['list']
[{u'event': u'a', u'_id': ObjectId('4d5b...0000'), u'uid': 1, u'time': 1},
{u'event': u'b', u'_id': ObjectId('4d5b...0001'), u'uid': 1, u'time': 2}]
>>> int(result[1]['uid'])
2
>>> result[1]['list']
[{u'event': u'c', u'_id': ObjectId('4d5b...0002'), u'uid': 2, u'time': 2}]
>>> int(result[2]['uid'])
3
>>> result[2]['list']
[{u'event': u'd', u'_id': ObjectId('4d5b...0003'), u'uid': 3, u'time': 4}]

我缩短了上面 list 中的对象 ID 以提高可读性。

关于python - 如何在 pymongo 中使用 "group"对相似行进行分组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5010624/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com