gpt4 book ai didi

mongodb - 如何使用 mongodb 集合运算符寻址数组

转载 作者:可可西里 更新时间:2023-11-01 10:04:17 26 4
gpt4 key购买 nike

使用示例邮政编码集合,我有一个这样的查询:

db.zipcodes.aggregate([
{ "$match": {"state": {"$in": ["PA","NY"]}}},
{ "$group": { "_id": { "city": "$city" }, "ZipsPerCity": {"$addToSet": "$_id"}}},
{ "$match": { "ZipsPerCity" : { "$size": 2 }}},
]).pretty()

这只是一个查找具有 2 个邮政编码的城市(在纽约州和宾夕法尼亚州)的示例:

{
"_id" : {
"city" : "BETHLEHEM"
},
"ZipsPerCity" : [
"18018",
"18015"
]
}
{
"_id" : {
"city" : "BEAVER SPRINGS"
},
"ZipsPerCity" : [
"17843",
"17812"
]
}

现在假设我想使用“$setDifference”集合运算符比较“BEAVER SPRINGS”邮政编码和“BETHLEHEM”邮政编码?我尝试在 $project 运算符中使用“$setDifference”运算符,如下所示:

db.zipcodes.aggregate([
{ "$match": { "state": {"$in": ["PA","NY"]}}},
{ "$group": { "_id: {city : "$city"},"ZipsPerCity": {$addToSet: "$_id"}}},
{ "$match": { "ZipsPerCity" : { $size: 2 }}},
{ "$project": {
"int": { "$setDifference":[
"$_id.city.BETHLEHEM.ZipsPerCity",
"$_id.city.BEAVER SPRINGS.ZipsPerCity"
]}
}}
]).pretty()

这甚至看起来都不对,更不用说产生结果了。虽然没有错误。

您如何使用 $setDifference(或任何集合运算符)像这样引用使用 $addToSet 构建的几个数组?

最佳答案

关于您在这里尝试做的第一件事是您要比较的数组实际上在两个不同的文档中。事实上,所有聚合框架运算符一次只能处理一个文档,$group 除外。这是为了“聚合”文件,可能$unwind这实际上将一份文件变成了多份文件。

为了进行比较,您需要数据出现在一个 文档中,或者至少以某种方式“配对”。所以有一种技术可以做到这一点:

db.zipcodes.aggregate([
{ "$match": {"state": { "$in": [ "PA","NY" ] } }},
{ "$group": {
"_id": "$city",
"ZipsPerCity": { "$addToSet": "$_id"}
}},
{ "$match": { "ZipsPerCity" : { "$size": 2 } }},
{ "$group": {
"_id": null,
"A": { "$min": {
"$cond": [
{ "$eq": [ "$_id", "BETHLEHEM" ] },
{ "city": "$_id", "ZipsPerCity": "$ZipsPerCity" },
false
]
}},
"B": { "$min": {
"$cond": [
{ "$eq": [ "$_id", "BEAVER SPRINGS" ] },
{ "city": "$_id", "ZipsPerCity": "$ZipsPerCity" },
false
]
}}
}},
{ "$project": {
"A": 1,
"B": 1,
"C": { "$setDifference": [ "$A.ZipsPerCity", "$B.ZipsPerCity" ] }

}}
])

这有点做作,我很清楚实际结果集有两个以上的城市,但重点是说明数组/集合发送到“集合运算符”,如 $setDifference需要在同一个文档中。

此处的结果将“左”数组与“右”数组进行比较,返回“左”与“右”不同的成员。这两个集合在这里都是独一无二的,没有重叠,所以结果应该是预期的:

{
"_id" : null,
"A" : {
"city" : "BETHLEHEM",
"ZipsPerCity" : [
"18018",
"18015"
]
},
"B" : {
"city" : "BEAVER SPRINGS",
"ZipsPerCity" : [
"17843",
"17812"
]
},
"C" : [
"18018",
"18015"
]
}

用普通成员的实际“集合”可以更好地说明这一点。所以这个文档:

{ "A" : [ "A", "A", "B", "C", "D" ], "B" : [ "B", "C" ] }

回应$setDifference :

{ "C" : [ "A", "D" ] }

$setEquals :

{ "C" : false }

$setIntersection :

{ "C" : [ "B", "C" ] }

$setUnion :

{ "C" : [ "B", "D", "C", "A" ] }

$setIsSubSet将顺序反转为 $B$A:

{ "C" : true }

其他集合运算符$anyElementTrue$allElementsTrue$map 一起使用时可能最有用可以 reshape 数组并针对每个元素评估条件的运算符。

$map 的一个很好的用法在$setDifference旁边,您可以在不使用 $unwind 的情况下“过滤”数组内容:

db.arrays.aggregate([
{ "$project": {
"A": {
"$setDifference": [
{
"$map": {
"input": "$A",
"as": "el",
"in": {
"$cond": [
{ "$eq": [ "$$el", "A" ] },
"$$el",
false
]
}
}
},
[false]
]
}
}}
])

当您在管道中有很多结果并且您不想通过“展开”数组来“展开”所有这些结果时,这会非常方便。但请注意,这是一个“集合”,因此只返回一个匹配“A”的元素:

{ "A" : ["A"] }

所以这里要记住的是你:

  1. 一次只在“同一个”文档中操作
  2. 结果通常是“集合”,这意味着它们既“唯一”又“无序”。

总体而言,这应该是对 set operators 的一个不错的总结。是什么以及如何使用它们。

关于mongodb - 如何使用 mongodb 集合运算符寻址数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24273077/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com