- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想获取所有其他字段的每个站的最后一个文档:
{
"_id" : ObjectId("535f5d074f075c37fff4cc74"),
"station" : "OR",
"t" : 86,
"dt" : ISODate("2014-04-29T08:02:57.165Z")
}
{
"_id" : ObjectId("535f5d114f075c37fff4cc75"),
"station" : "OR",
"t" : 82,
"dt" : ISODate("2014-04-29T08:02:57.165Z")
}
{
"_id" : ObjectId("535f5d364f075c37fff4cc76"),
"station" : "WA",
"t" : 79,
"dt" : ISODate("2014-04-29T08:02:57.165Z")
}
db.temperature.aggregate([{$sort:{"dt":1}},{$group:{"_id":"$station", result:{$last:"$dt"}, t:{$last:"$t"}}}])
{
"result" : [
{
"_id" : "WA",
"result" : ISODate("2014-04-29T08:02:57.165Z"),
"t" : 79
},
{
"_id" : "OR",
"result" : ISODate("2014-04-29T08:02:57.165Z"),
"t" : 82
}
],
"ok" : 1
}
最佳答案
直接回答您的问题,是的,这是最有效的方法。但我确实认为我们需要澄清为什么会这样。
正如替代方案中所建议的那样,人们正在关注的一件事是在传递给 之前对您的结果进行“排序”。 $group
stage 和他们正在查看的是“timestamp”值,因此您需要确保所有内容都按“timestamp”顺序排列,因此形式如下:
db.temperature.aggregate([
{ "$sort": { "station": 1, "dt": -1 } },
{ "$group": {
"_id": "$station",
"result": { "$first":"$dt"}, "t": {"$first":"$t"}
}}
])
_id
字段(默认为
ObjectId
)已经按“时间戳”顺序排列,因为它本身实际上包含一个时间值,这使得语句成为可能:
db.temperature.aggregate([
{ "$group": {
"_id": "$station",
"result": { "$last":"$dt"}, "t": {"$last":"$t"}
}}
])
_id
)所以
$last
边界是完全有效的。无论如何,您都在扫描所有内容,您还可以在
_id
上“范围”查询值在两个日期之间同样有效。
$match
在进行这种累积而不是获取“第一个”和“最后一个”时的日期范围之间
_id
值来定义“范围”或在您的实际使用中类似的东西。
var stations = [
"AL", "AK", "AZ", "AR", "CA", "CO", "CT", "DE", "FL",
"GA", "HI", "ID", "IL", "IN", "IA", "KS", "KY", "LA",
"ME", "MD", "MA", "MI", "MN", "MS", "MO", "MT", "NE",
"NV", "NH", "NJ", "NM", "NY", "NC", "ND", "OH", "OK",
"OR", "PA", "RI", "SC", "SD", "TN", "TX", "UT", "VT",
"VA", "WA", "WV", "WI", "WY"
];
for ( i=0; i<200000; i++ ) {
var station = stations[Math.floor(Math.random()*stations.length)];
var t = Math.floor(Math.random() * ( 96 - 50 + 1 )) +50;
dt = new Date();
db.temperatures.insert({
station: station,
t: t,
dt: dt
});
}
$sort
由于存在索引而被优化掉,所花费的时间似乎与索引选择然后加载索引条目有关。包括“覆盖”索引查询的所有字段没有区别。
_id
值,那么确实在插入顺序上使用自然索引实际上是最有效的方法。您的现实世界里程可能会因这对您是否实用而有所不同,并且最终可能会更方便地在日期上实现索引和排序。
_id
感到满意范围或大于“最后一个”
_id
在您的查询中,然后可能进行一次调整以获取值以及您的结果,以便您实际上可以在连续查询中存储和使用该信息:
db.temperature.aggregate([
// Get documents "greater than" the "highest" _id value found last time
{ "$match": {
"_id": { "$gt": ObjectId("536076603e70a99790b7845d") }
}},
// Do the grouping with addition of the returned field
{ "$group": {
"_id": "$station",
"result": { "$last":"$dt"},
"t": {"$last":"$t"},
"lastDoc": { "$last": "$_id" }
}}
])
ObjectId
的最大值。从您的结果中提取并在下一个查询中使用它。
关于MongoDB : Aggregation framework : Get last dated document per grouping ID,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23360551/
刚刚收到一条错误消息,内容为“union __anonymous 只能是聚合的一部分”。我对此并不感到困惑,因为我正在尝试一些我知道不应该起作用的东西。 但这让我想知道 D 中“聚合”的确切定义是什么
我最近在研究ES,发现可以达到几乎相同的结果,但是对于这两者之间的 DIFFERENCE ,我不清楚。 "Filter then Aggregation" POST kibana_sample_dat
给定用户和订单表,我需要计算在注册日期后的第二天首次下单的用户。 我设法通过以下查询列出了此类用户: SELECT users.first_name as first_name, users.
我有我的文档,它们包含嵌套的“事件”(如网站上的点击)文档。 现在我想计算 name=x 的嵌套事件和 name=y 的嵌套事件之间的比率 这是我的查询: curl -XGET http://192.
在我的项目中,我发现需要以分层方式打破我的聚合,使用顶级根级别聚合,以确保根级别的规则一致性,然后我的根下的对象可以分组为各种聚合。在计算根级聚合的完整性时,根验证自己的规则,然后委托(delegat
我想通过 MongoTemplate 执行的代码: { $merge: { into: 'someCollection', on: "_id",
在过去的两周里,我一直在研究DDD,而真正令我难忘的一件事是聚合根如何包含其他聚合根。从存储库中检索聚合根,但是如果一个根包含另一个根,该存储库是否具有对另一个存储库的引用,并要求其构建子根? 最佳答
我对如何设计聚合有疑问。 我有Company , City , Province和 Country实体。其中每一个都需要是其自身聚合的聚合根。 City , Province和 Country实体在整
我对如何设计聚合有疑问。 我有Company , City , Province和 Country实体。其中每一个都需要是其自身聚合的聚合根。 City , Province和 Country实体在整
我目前正在开发 DDD 应用程序,我对如何处理似乎必须从另一个聚合根访问聚合根的场景感到困惑。这是我的边界上下文的概述: 用户可以加入该站点并就他们感兴趣的主题创建帖子。他们还可以创建群组并针对他们创
我正在用 reSolve 做我的第一个项目,但在 DDD、ES 和 CQRS 方面的经验有限。所以,也许有一个非常简单的解决方案,但我还没有找到。 我的问题:在我的项目中,一个聚合的状态(订单状态)实
https://howtoprogram.xyz/2017/02/18/using-group-apache-cassandara/ 我试图在 azure cosmos cassandra db 中执
使用 Siddhi 3.0.3 作为 Java 库。 我通过扩展 AttributeAggregator 类开发了自定义聚合函数,并且在调用 processRemove() 方法后我看到了一些奇怪的行
我正在尝试对一个公司拥有许多团队的问题进行建模。有一条业务规则“每个公司的团队名称必须是唯一的”。然而,团队还有许多其他行为,例如加入。此外,一个团队可以有许多报告 - 它们维护对Team.Id的引用
我正在尝试将总计的结果相加并将其减去总计,但我看到以下错误: 想象一下这样的事情 第一个子查询:1 3 5 7第二个子查询:2 4 6 总计:(1+3+5+7) - (2+4+6) = 4 这是我的查
我有以下 DDD 场景,分为以下聚合: 用户, friend (用户协会), 文件(供用户上传), 图库(文件分组), 消息(用户通信), 群组(用户可以创建,其他成员可以加入), GroupMess
这个问题之前已经讨论过,但没有一个答案能解决我的具体问题,因为我正在处理内部和外部选择中的不同 where 子句。该查询在 Sybase 下执行得很好,但在 SQL Server 下执行时会出现本文标
上下文 我使用 Azure 门户创建了一个流作业,该门户使用每日 TUMBLINGWINDOW 聚合数据。下面附上了一个代码片段,修改自 docs ,这显示了类似的逻辑。 SELECT DAT
我正在执行以下查询 SELECT DISTINCT n.nid AS entity_id FROM node n INNER JOIN og_membership om ON n.nid=om.eti
我的各种 docker 容器都导出 prometheus 指标,但是我们的 prometheus 安装只需要从一个端点提取所有指标。不幸的是,这无法更改。因此,我需要通过安装普罗米修斯来收集所有指标。
我是一名优秀的程序员,十分优秀!