gpt4 book ai didi

mongodb - 使用另一个集合中的属性在 mongodb 上过滤文档的更好方法

转载 作者:可可西里 更新时间:2023-11-01 09:50:23 24 4
gpt4 key购买 nike

我正在尝试使用来自另一个集合的属性来过滤 mongodb 上的文档,但问题是我需要先获取所有对象,然后再进行过滤。这是我目前的情况:

当前数据:

/* Message collection */
/* 1 */
{
"_id" : ObjectId("571063533e41b42c2753828a"),
"user" : ObjectId("570ae3d0a27d4cd44730fc38"),
"text" : "First text",
"enabled" : true,
"deleted" : false,
"__v" : 0
}

/* 2 */
{
"_id" : ObjectId("5712a9be27adcff81ea5a39f"),
"user" : ObjectId("5f236vgh74de563swer120rt"),
"text" : "Second text",
"deleted" : false,
"enabled" : true,
"__v" : 0
}

/* User collection */
/* 1 */
{
"_id" : ObjectId("570ae3d0a27d4cd44730fc38"),
"email" : "test@test.com",
"showMessage" : true,
"__v" : 0
}

/* 2 */
{
"_id" : ObjectId("5f236vgh74de563swer120rt"),
"email" : "test1@test.com",
"showMessage" : false,
"__v" : 0
}

当前过滤方式:

Message.aggregate([{
$match: {
enabled: true,
deleted: false
}
}, {
$lookup: {
from: 'users',
localField: 'user',
foreignField: '_id',
as: 'user'
}
}], function(err, messages) {
if (err) {
reject(err);
} else {
var filteredMessages = this.filterMessages(messages);
//do other stuff with the filtered data
}
});

filterMessages(messages) {
return messages.filter((current) => {
return current.user[0].showMessage;
});
}

如您所见,我正在尝试使用 user 的属性 showMessages 获取 messages,但我正在执行过滤器在我先收到所有消息之后,这是一种低效的方法。

有没有办法只获取我需要的消息,使用另一个集合中的属性过滤它们?

注意:我需要使用用户属性过滤所有消息,而不是相反,我的意思是,我无法获取用户,然后再过滤消息。

最佳答案

直接在聚合中做:

Message.aggregate([
{ "$match": {
"enabled": true,
"deleted": false
}},
{ "$lookup": {
"from": "users",
"localField": "user",
"foreignField": "_id",
"as": "user"
}},
{ "$unwind": "user" },
{ "$redact": {
"if": "$user.showMessage",
"then": "$$KEEP",
"else": "$$PRUNE"
}}
],function(err,messages) {
if (err) reject(err);
// Already filtered
})

所以你$unwind单一关系(因为 $lookup 是“左连接”),然后在值为 true/false 的条件下简单地 $redact

或者反过来执行$lookup,这可能会更高效:

User.aggregate([
{ "$match": { "showMessage": true } },
{ "$lookup": {
"from": "messages",
"localField": "_id",
"foreignField": "user",
"as": "messages"
}},
{ "$unwind": "$messages" },
{ "$match": {
"messages.enabled": true,
"messages.deleted": false
}},
{ "$project": {
"_id": "$messages._id",
"user": {
"_id": "$_id",
"email": "$email",
"showMessage": "$showMessage"
},
"text": "$messages.text",
"deleted": "$messages.deleted",
"enabled": "$messages.enabled"
}}
],function(err,messages) {

})

目前$lookup除了匹配“本地”和“外部”字段属性之外,运算符本身不会根据任何其他条件“查询”文档。这在以后的版本中可能会发生变化。

不过现在,您可以在后续的聚合管道阶段进行进一步的“过滤”。


另一种情况实际上是在“反向”查询中获取有效 User 数据的 _id 值,然后只检索消息。但当然前提是 $in 的结果列表实际上并不太大:

async.waterfall
[
function(callback) {
User.find({ "showMesage": true }).select("_id").exec(callback);
},
function(users,callback) {
Message.find({
"user": { "$in": users.map((current) => { return current._id }) },
"enabled": true,
"deleted": false
}).populate("user").exec(callback);
}
],function(err,messages) {
// filter and populated
}
)

$lookup 相比,这是额外的查询,但是它在结束比赛时处理的结果较少。

这实际上取决于您的数据情况,以决定哪种方法在这里最有效,因此您确实应该对其进行测试。我的猜测是 $lookup 的“反向”收藏选择或者后一种情况只使用 $in会是更好的选择。但这实际上取决于哪个查询产生的结果最少,哪个“顺序”最好。

关于mongodb - 使用另一个集合中的属性在 mongodb 上过滤文档的更好方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36670294/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com