gpt4 book ai didi

mongodb 聚合查询在使用 $sum 时没有返回正确的总和

转载 作者:IT老高 更新时间:2023-10-28 12:29:51 24 4
gpt4 key购买 nike

我有一个学生的集合,文件格式如下:-

{
_id:"53fe74a866455060e003c2db",
name:"sam",
subject:"maths",
marks:"77"
}
{
_id:"53fe79cbef038fee879263d2",
name:"ryan",
subject:"bio",
marks:"82"
}
{
_id:"53fe74a866456060e003c2de",
name:"tony",
subject:"maths",
marks:"86"
}

我想计算所有主题为“数学”的学生的总分。所以我应该得到 163 的总和。

db.students.aggregate([{ $match : { subject : "maths" } },
{ "$group" : { _id : "$subject", totalMarks : { $sum : "$marks" } } }])

现在我应该得到以下结果-

{"result":[{"_id":"53fe74a866455060e003c2db", "totalMarks":163}], "ok":1}

但我得到-

{"result":[{"_id":"53fe74a866455060e003c2db", "totalMarks":0}], "ok":1}

有人能指出我在这里做错了什么吗?

最佳答案

您当前的架构具有作为字符串的 marks 字段数据类型,并且您需要一个整数数据类型供您的聚合框架计算总和。另一方面,您可以使用 MapReduce计算总和,因为它允许在其映射函数中的对象属性上使用原生 JavaScript 方法,如 parseInt()。所以总的来说你有两个选择。


选项 1:更新架构(更改数据类型)

首先是更改架构或在文档中添加另一个字段,该字段具有实际数值而不是字符串表示。如果你的集合文件比较小,你可以结合使用 mongodb 的游标 find(), forEach()update() 方法来更改标记架构:

db.student.find({ "marks": { "$type": 2 } }).snapshot().forEach(function(doc) {
db.student.update(
{ "_id": doc._id, "marks": { "$type": 2 } },
{ "$set": { "marks": parseInt(doc.marks) } }
);
});

对于较大的集合大小,您的数据库性能会很慢,建议使用 mongo bulk updates为此:

MongoDB 版本 >= 2.6 和 <3.2:

var bulk = db.student.initializeUnorderedBulkOp(),
counter = 0;

db.student.find({"marks": {"$exists": true, "$type": 2 }}).forEach(function (doc) {
bulk.find({ "_id": doc._id }).updateOne({
"$set": { "marks": parseInt(doc.marks) }
});

counter++;
if (counter % 1000 === 0) {
// Execute per 1000 operations
bulk.execute();

// re-initialize every 1000 update statements
bulk = db.student.initializeUnorderedBulkOp();
}
})

// Clean up remaining operations in queue
if (counter % 1000 !== 0) bulk.execute();

MongoDB 3.2 及更高版本:

var ops = [],
cursor = db.student.find({"marks": {"$exists": true, "$type": 2 }});

cursor.forEach(function (doc) {
ops.push({
"updateOne": {
"filter": { "_id": doc._id } ,
"update": { "$set": { "marks": parseInt(doc.marks) } }
}
});

if (ops.length === 1000) {
db.student.bulkWrite(ops);
ops = [];
}
});

if (ops.length > 0) db.student.bulkWrite(ops);

选项 2:运行 MapReduce

第二种方法是用 MapReduce 重写您的查询。您可以在其中使用 JavaScript 函数 parseInt()

在您的MapReduce操作,定义处理每个输入文档的map函数。此函数将转换后的 marks 字符串值映射到每个文档的 subject,并发出 subject 和转换后的 marks一对。这是可以应用 JavaScript 原生函数 parseInt() 的地方。注意:函数中,this指的是map-reduce操作正在处理的文档:

var mapper = function () {
var x = parseInt(this.marks);
emit(this.subject, x);
};

接下来,使用两个参数keySubjectvaluesMarks 定义相应的reduce 函数。 valuesMarks 是一个数组,其元素是由 map 函数发出并按 keySubject 分组的整数 marks 值。该函数将 valuesMarks 数组简化为其元素的总和。

var reducer = function(keySubject, valuesMarks) {
return Array.sum(valuesMarks);
};

db.student.mapReduce(
mapper,
reducer,
{
out : "example_results",
query: { subject : "maths" }
}
);

使用您的集合,上面将把您的 MapReduce 聚合结果放入一个新集合 db.example_results。因此,db.example_results.find() 将输出:

/* 0 */
{
"_id" : "maths",
"value" : 163
}

关于mongodb 聚合查询在使用 $sum 时没有返回正确的总和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29561380/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com