gpt4 book ai didi

javascript - MongoDB:如何使用正则表达式重命名字段

转载 作者:行者123 更新时间:2023-11-30 12:38:52 25 4
gpt4 key购买 nike

我的文档中有一个字段,它以时间戳命名,如下所示:

{
_id: ObjectId("53f2b954b55e91756c81d3a5"),
domain: "example.com",
"2014-08-07 01:25:08": {
A: [
"123.123.123.123"
],
NS: [
"ns1.example.com.",
"ns2.example.com."
]
}
}

这对于查询来说非常不切实际,因为每个文档都有不同的时间戳。因此,我想将所有文档的此字段重命名为固定名称。但是,我需要能够使用正则表达式匹配字段名称,因为它们都是不同的。

我试过这样做,但这是一个非法查询。

db['my_collection'].update({}, {$rename:{ /2014.*/ :"201408"}}, false, true);

有人能解决这个问题吗?

基于 NEIL LUNN 的回答的解决方案:

conn = new Mongo();
db = conn.getDB("my_db");

var bulk = db['my_coll'].initializeOrderedBulkOp();
var counter = 0;

db['my_coll'].find().forEach(function(doc) {

for (var k in doc) {
if (k.match(/^2014.*/) ) {
print("replacing " + k)
var unset = {};
unset[k] = 1;
bulk.find({ "_id": doc._id }).updateOne({ "$unset": unset, "$set": { WK1: doc[k]} });
counter++;
}

}

if ( counter % 1000 == 0 ) {
bulk.execute();
bulk = db['my_coll'].initializeOrderedBulkOp();
}

});

if ( counter % 1000 != 0 )
bulk.execute();

最佳答案

这不是 mapReduce 操作,除非您想要一个仅包含从 mapReduce 输出生成的 _idvalue 字段的新集合,很像:

    "_id": ObjectId("53f2b954b55e91756c81d3a5"), 
"value": {
"domain": "example.com",
...
}
}

这充其量只是对您的收藏集进行的一种“服务器端”改造,但当然不是您想要的结构。

虽然有多种方法可以执行服务器中的所有代码,但请不要尝试这样做,除非您确实处于困境。无论如何,这些方法通常不能很好地处理分片,这通常是人们“真正处于一个位置”的地方,因为记录的绝对大小。

当您想要更改内容并批量执行时,您通常必须“循环”收集结果并在访问当前文档信息的同时处理更新。也就是说,如果您的“更新”是“基于”文档的字段或结构中已包含的信息。

因此没有可用的“正则表达式替换”操作,当然也没有用于重命名字段的操作。所以让我们循环 bulk operations无需在服务器上运行所有代码的“最安全”形式。

var bulk = db.collection.initializeOrderedBulkOp();
var counter = 0;

db.collection.find().forEach(function(doc) {

for ( var k in doc ) {
if ( doc[k].match(/^2014.*/) ) {
var update = {};
update["$unset"][k] = 1;
update["$set"][ k.replace(/(\d+)-(\d+)-(\d+).+/,"$1$2$3") ] = doc[k];
bulk.find({ "_id": doc._id }).updateOne(update);
counter++;
}
}

if ( counter % 1000 == 0 ) {
bulk.execute();
bulk = db.collection.initializeOrderedBulkOp();
}

});

if ( counter % 1000 != 0 )
bulk.execute();

所以主要的东西是$unset运算符删除现有字段和 $set运算符在文档中创建新字段。您需要文档内容来检查和使用“字段名称”和“值”,因此没有其他方法可以循环。

如果您的服务器上没有 MongoDB 2.6 或更高版本,那么循环概念仍然存在,没有立即的性能优势。您可以查看类似 .eval() 的内容为了在服务器上处理,但正如文档所建议的那样,确实不推荐这样做。如果必须,请谨慎使用。

关于javascript - MongoDB:如何使用正则表达式重命名字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25202418/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com