gpt4 book ai didi

regex - 使用字段的子字符串对文档进行分组

转载 作者:可可西里 更新时间:2023-11-01 10:04:02 26 4
gpt4 key购买 nike

我正在使用 MongoDB,我非常享受!有一个查询我在处理时遇到问题:我有这组表示层次结构的数据(一棵树,其中 1 是根,1.1 和 1.2 是 1 的子级,依此类推)

db.test.insert({id:1, hierarchy:"1"})
db.test.insert({id:2, hierarchy:"1.1"})
db.test.insert({id:3, hierarchy:"1.2"})
db.test.insert({id:4, hierarchy:"1.1.1"})
db.test.insert({id:5, hierarchy:"1.1.2"})
db.test.insert({id:6, hierarchy:"1.2.1"})
db.test.insert({id:7, hierarchy:"1.2.2"})
db.test.insert({id:8, hierarchy:"1.2.3"})

所以如果我进行查询:

> db.test.find()
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4760"), "id" : 1, "hierarchy" : "1" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4761"), "id" : 2, "hierarchy" : "1.1" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4762"), "id" : 3, "hierarchy" : "1.2" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4763"), "id" : 4, "hierarchy" : "1.1.1" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4764"), "id" : 5, "hierarchy" : "1.1.2" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4765"), "id" : 6, "hierarchy" : "1.2.1" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4766"), "id" : 7, "hierarchy" : "1.2.2" }
{ "_id" : ObjectId("546a6095cafd2fa3ff8e4767"), "id" : 8, "hierarchy" : "1.2.3" }

id 为 1 的文档代表 CEO,我想收集有关 VP(1.1 和 1.2)下的团队的信息。

我想要这样的输出

{
id: null,
teams:
[
{
manager: 2,
hierarchy: "1.1",
subordinates: 2
},
{
manager: 3,
hierarchy: "1.2",
subordinates: 3
}
]
}

我在将文档聚合到正确的“位置”时遇到问题。我尝试使用正则表达式使用子字符串进行聚合,并在分组之前进行投影并创建一个新字段“manager_hierarchy”,因此我可以使用该字段进行分组。但是这些方法我都没有取得任何成功,所以我现在被困住了。

无论如何我可以完成这个任务吗?

编辑:抱歉,我忘了明确说明一件事:该查询是获取员工下属团队的信息。我以 CEO 为例,但如果我是层次结构中的员工 1.2.3,我希望看到团队 1.2.3.1、1.2.3.2、...、1.2.3.xx

也有可能(很少见,但有可能)某人拥有超过 9 个下属,因此制作“硬编码”子字符串是行不通的,因为

$substr:["$hierarchy",0,3]} 

适用于 1.2 但不适用于 1.10和 $substr:["$hierarchy",0,4]}

适用于 1.10,但不适用于 1.2

最佳答案

您可以使用以下聚合 管道操作获得结果。

  • 根据行的层次结构对行进行排序,以便经理排在首位。
  • Group 以相似的 ancestors 开头的记录。(即 1.1或 1.2,...)。 manager 记录将在每个 grouptop 上由于上面的 sort 操作。
  • 取每个count,所以下属的个数将是 count-1(经理记录)
  • 再次分组记录以获得单个数组。

代码:

db.test.aggregate([
{$match:{"id":{$gt:1}}},
{$sort:{"hierarchy":1}},
{$group:{"_id":{"grp":{$substr:["$hierarchy",0,3]}},
"manHeir":{$first:"$hierarchy"},
"count":{$sum:1},"manager":{$first:"$id"}}},
{$project:{"manager":1,
"hierarchy":"$manHeir",
"subordinates":{$subtract:["$count",1]},"_id":0}},
{$group:{"_id":null,"teams":{$push:"$$ROOT"}}},
{$project:{"_id":0,"teams":1}}
])

关于regex - 使用字段的子字符串对文档进行分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26981960/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com