- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经通过以下命令生成了直方图:
db.mydb.aggregate([{ $bucketAuto: { groupBy: "$userId", buckets: 1e9 } }])
假设我的唯一身份用户少于 10 亿(并且有足够的内存),这会为我提供每个用户的文档数。
User Docs
===== ====
userA 3
userB 1
userC 5
userD 1
我想获取此直方图的结果并进行透视以计算每个文档计数的用户数。
结果如下:
Docs Users
==== =====
1 2
2 0
3 1
4 0
5 1
在 MongoDB 中是否有一种简单、实用的方法可以做到这一点?
最佳答案
您可以从简单开始的一件事$group阶段:
db.col.aggregate([
{
$group: {
_id: "$docs",
count: { $sum: 1 }
}
},
{
$project: {
_id: 0,
docs: "$_id",
users: "$count"
}
},
{
$sort: { docs: 1 }
}
])
这会给你以下结果:
{ "docs" : 1, "users" : 2 }
{ "docs" : 3, "users" : 1 }
{ "docs" : 5, "users" : 1 }
那么没有用户的文档就是缺失的部分。您可以从您的应用程序或 MongoDB(如下所示)添加它们:
db.col.aggregate([
{
$group: {
_id: "$docs",
count: { $sum: 1 }
}
},
{
$group: {
_id: null,
histogram: { $push: "$$ROOT" }
}
},
{
$project: {
values: {
$map: {
input: { $range: [ { $min: "$histogram._id" }, { $add: [ { $max: "$histogram._id" }, 1 ] } ] },
in: {
docs: "$$this",
users: {
$let: {
vars: {
current: { $arrayElemAt: [ { $filter: { input: "$histogram", as: "h", cond: { $eq: [ "$$h._id", "$$this" ] } } }, 0 ] }
},
in: {
$ifNull: [ "$$current.count", 0 ]
}
}
}
}
}
}
}
},
{
$unwind: "$values"
},
{
$replaceRoot: {
newRoot: "$values"
}
}
])
这里的想法是,我们可以通过 null
来$group
,这会生成包含前一阶段所有文档的单个文档。知道 $min
和 $max
值,我们可以生成 $range数字和 $map该范围为现有计数或默认值 0。然后我们可以使用 $unwind和 $replaceRange获取每个文档的单个直方图点。输出:
{ "docs" : 1, "users" : 2 }
{ "docs" : 2, "users" : 0 }
{ "docs" : 3, "users" : 1 }
{ "docs" : 4, "users" : 0 }
{ "docs" : 5, "users" : 1 }
关于javascript - histogram 直方图的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56980789/
我正在通过阅读 doc 和 src 来学习 d3-array。 histogram.value's doc很详细,但我还是觉得很难掌握。 The source code有助于更好地理解文档,但我仍
我正在尝试使用 qmake 和 make 为 uEye 相机编译相机软件。 我的 qmake 命令运行正常,但是当我在命令行中键入 make 时出现以下错误 make[1]: Entering dir
Elasticsearch Histogramfacet似乎不支持 all_terms = true(即:即使 count=0 也返回 facetvalue/bucket) 这是正确的吗? 最佳答案
我知道我可以用 pandas 绘制直方图: df4 = pd.DataFrame({'a': np.random.randn(1000) + 1}) df4['a'].hist() 但是我怎样才能从这
我有一个整个数据集的直方图,我想将它与该数据的过滤子集的直方图进行比较。我可以在两个单独的工作表中执行此操作,然后在仪表板中并排显示它们。 有没有办法将这两个直方图组合成一个具有公共(public)轴
我有一个小型办公网络,我遇到了巨大的互联网链接延迟。我们有一个简单的网络拓扑结构:一台计算机配置为运行 ubuntu 服务器 10.10 的路由器,2 个网卡(一个连接互联网,另一个连接办公网络)和一
我正在研究 Google Tensorboard,我对直方图的含义感到困惑。我阅读了教程,但我似乎不清楚。如果有人能帮助我弄清楚 Tensorboard 直方图每个轴的含义,我真的很感激。 来自 Te
根据Prometheus文档,为了使用直方图度量具有95%的百分位数,我可以使用以下查询: histogram_quantile(0.95, sum(rate(http_request_duratio
我正在为图片上的直方图编写一个 CUDA 内核,但我不知道如何从内核返回一个数组,并且当其他线程读取它时数组会发生变化。有什么可能的解决方案吗? __global__ void Hist( T
使用 elasticsearch,我想在我的模型中获取价格字段的直方图分面。在事先不知道最低和最高价格的情况下,我想要的是让直方图覆盖整个价格范围,并具有一定数量的间隔,比如 10。我可以从文档中看到
我在 NetLogo 5.0.5 的模型中创建了一个变量的直方图,但直方图一直显示一条线而不是我想要的条。我在锅设置区域使用 set-histogram-num-bars n,但没有任何变化。在模型库
我正在构建一个使用 CIAreaHistogram 的应用程序核心图像过滤器。我使用 inputCount用于测试的值(桶数)为 10,以及 inputScale值为 1。 我得到 CIImage对于
在 R 中,使用 ecdf我可以绘制经验累积分布函数 plot(ecdf(mydata)) 并与 hist我可以绘制数据的直方图 hist(mydata) 如何在同一个图中绘制直方图和 ecdf? 编
给定每小时都有数据点的(电力)市场数据的时间序列,我想显示一个包含每小时数据的所有时间/时间范围平均值的条形图,以便分析师可以轻松地将实际价格与所有时间平均值进行比较(一天中哪个小时最贵/最便宜)。
我已经通过以下命令生成了直方图: db.mydb.aggregate([{ $bucketAuto: { groupBy: "$userId", buckets: 1e9 } }]) 假设我的唯一身份
我是 influxdb 中的 flux 新手,正在尝试编写用于生成直方图的 flux 查询。文档中给出的函数 https://docs.influxdata.com/flux/v0.24/functi
对于在多实例上运行的应用程序,我找不到任何文章描述使用 datadog 直方图与 datadog 分布相比的优势。有人可以帮助我在这两者之间做出最佳选择吗? 最佳答案 我在 DataDog 文档中发现
分箱过程是点特征直方图估计的一部分,结果是 b^3如果仅使用三个角度特征(alpha、phi、theta),则为 bins,其中 b 是 bins 的数量。 为什么是这样b^3而不是 b * 3 ?
我想测量 16 位图像中的像素强度。因此,我制作了一个 numpy 直方图,显示像素数与灰度值从 0 到 65535(16 位)的关系。我用的是 hist= numpy.histogram(grays
我正在使用这个: http://docs.scipy.org/doc/numpy/reference/generated/numpy.histogram.html 我有一个列表a,我想这样使用: nu
我是一名优秀的程序员,十分优秀!