gpt4 book ai didi

java - 从 MongoDB 中的一个查询中获取多个字段计数?

转载 作者:行者123 更新时间:2023-11-29 07:02:20 24 4
gpt4 key购买 nike

我有一个事件集合,其结构如下:

{
"_id" : ObjectId("537b3ff288f4ca2f471afcae"),
"Name" : "PREMISES MAP DELETED",
"ScreenName" : "AccessPointActivity",
"Timestamp" : NumberLong("1392113758000"),
"EventParams" : "null",
"TracInfo" : {
"ApplicationId" : "fa41f204bfc711e3b9f9c8cbb8c502c4",
"DeviceId" : "2_1VafJVPu4yfdbMWO1XGROjK6iQZhq4hAVCQL837W",
"UserId" : "pawan",
"SessionId" : "a8UHE16mowNwNGyuLXbW",
"WiFiAP" : "null",
"WiFiStrength" : 0,
"BluetoothID" : "null",
"BluetoothStrength" : 0,
"NetworkType" : "null",
"NetworkSubType" : "null",
"NetworkCarrier" : "Idea",
"Age" : 43,
"Gender" : "Female",
"OSVersion" : "16",
"Manufacturer" : "samsung",
"Resolution" : "600*976",
"Platform" : "Android",
"Latitude" : 40.42,
"Longitude" : -74,
"City" : "Monmouth County",
"CityLowerCase" : "monmouth county",
"Country" : "United States",
"CountryLowerCase" : "united states",
"Region" : "New Jersey",
"RegionLowerCase" : "new jersey",
"Time_zone" : "null",
"PinCode" : "07732",
"Locale" : ", Paradise Trailer Park",
"Accuracy" : 0,
"Timestamp" : NumberLong("1392113758000")
}
}

他们在不同的屏幕上有很多事件。

我的预期输出如下:

{
ApplicationId:"fa41f204bfc711e3b9f9c8cbb8c502c4",
EventName:"PREMISES MAP DELETED",
Eventcount:300,
ScreenviewCount:20,
DeviceCount:10,
UserCount:3
}

EventCount : EventName 的个数

ScreenviewCount : 它是每个 session 不同屏幕名称的计数

DeviceCount : 不同deviceId的个数

UserCount : 不同userCount的个数

他们将在多个屏幕(屏幕名称)上进行多个事件。

目前我正在使用以下方法:

  1. 使用聚合获取每个事件名称并计算例如:

      {    
    _id:
    {
    ApplicationId:"fa41f204bfc711e3b9f9c8cbb8c502c4",
    EventName:"PREMISES MAP DELETED"
    }
    EventCount:300

  2. 对于上述聚合结果中的每个事件名称,我在 while 循环中调用以下查询,直到聚合输出有文档:

a) 使用来自屏幕浏览计数聚合输出的 eventName 的不同查询(在事件收集上)。

b) 来自设备计数聚合输出的不同查询 eventName(在事件收集时)。

c) 用户计数聚合输出的不同查询事件名称(在事件收集上)。

问题是它很慢,因为它对聚合输出的每个结果都有 3 个不同的查询。

他们有没有办法在单个聚合调用或其他方式中做到这一点。

提前致谢!!!

最佳答案

您似乎错过的一般情况是,要在“事件”总计下获取文档中各个字段的“不同”值,您可以使用 $addToSet运营商。

根据定义,“集合”的所有值都是“唯一的/不同的”,因此您只想将所有这些可能的值保存在分组级别的“集合”中,然后获取生成的数组的“大小” ,这正是 $size 的内容MongoDB 2.6 中引入的运算符。

db.collection.aggregate([
{ "$group": {
"_id": {
"ApplicationId": "$TracInfo.ApplicationId",
"EventName": "$Name",
},
"oScreenViewCount": {
"$addToSet": {
"ScreenName": "$ScreenName",
"SessionId": "$TracInfo.SessionId",
}
},
"oDeviceCount": { "$addToSet": "$TracInfo.DeviceId" },
"oUserCount": { "$addToSet": "$TracInfo.UserId" },
"oEventcount": { "$sum": 1 }
}},
{ "$project": {
"_id": 0,
"ApplicationId": "$_id.ApplicationId",
"EventName": "$_id.EventName",
"EventCount": "$oEventCount",
"ScreenViewCount": { "$size": "$oScreenViewCount" },
"DeviceCount": { "$size": "$oDeviceCount" },
"UserCount": { "$size": "$oUserCount" }
}}
])

MongoDB 2.6 之前的版本需要更多工作,使用 $unwind$group计算数组:

db.collection.aggregate([
{ "$group": {
"_id": {
"ApplicationId": "$TracInfo.ApplicationId",
"EventName": "$Name",
},
"oScreenviewCount": {
"$addToSet": {
"ScreenName": "$ScreenName",
"SessionId": "$TracInfo.SessionId",
}
},
"oDeviceCount": { "$addToSet": "$TracInfo.DeviceId" },
"oUserCount": { "$addToSet": "$TracInfo.UserId" },
"oEventcount": { "$sum": 1 }
}},
{ "$unwind": "$oScreeenviewCount" },
{ "$group": {
"_id": "$_id",
"oScreenviewCount": { "$sum": 1 },
"oDeviceCount": { "$first": "$oDeviceCount" },
"oUserCount": { "$first": "$oUserCount" },
"oEventcount": { "$first": "$oEventCount" }
}},
{ "$unwind": "$oDeviceCount" },
{ "$group": {
"_id": "$_id",
"oScreenviewCount": { "$first": "$oScreenViewCount" },
"oDeviceCount": { "$sum": "$oDeviceCount" },
"oUserCount": { "$first": "$oUserCount" },
"oEventcount": { "$first": "$oEventCount" }
}},
{ "$unwind": "$oUserCount" },
{ "$group": {
"_id": "$_id",
"oScreenviewCount": { "$first": "$oScreenViewCount" },
"oDeviceCount": { "$first": "$oDeviceCount" },
"oUserCount": { "$sum": "$oUserCount" },
"oEventcount": { "$first": "$oEventCount" }
}},
{ "$project": {
"_id": 0,
"ApplicationId": "$_id.ApplicationId",
"EventName": "$_id.EventName",
"EventCount": "$oEventCount",
"ScreenViewCount": "$oScreenViewCount",
"DeviceCount": "$oDeviceCount",
"UserCount": "$oUserCount"
}}

])

$project的最终用法在第二个列表中,“o”前缀名称的所有一般用法实际上只是为了在最后美化结果并确保输出字段顺序与示例结果中的顺序相同。

作为一般免责声明,您的问题缺少确定用于这些总计的确切字段或组合的信息,但原则和方法是合理的,应该足够接近相同的实现。

所以本质上,您通过使用 $addToSet 获得“组”内的“不同”值无论字段或组合是什么,然后您都可以通过任何可用的方式确定这些“集合”的“计数”。

比在客户端代码中发出许多查询和合并结果要好得多。

关于java - 从 MongoDB 中的一个查询中获取多个字段计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24064723/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com