- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我们正在为我们的一个项目开发审计日志解决方案,非常感谢您的帮助。
我们有媒体实体,其中包含媒体 ID(数字)、操作(字符串,例如 PUBLISH)和发生日期,时间表示操作发生的日期和时间。
要求是删除超过 90 天的日志,但保留对媒体实体的最后操作的日志。
我们正在使用 Mongo 3.2
,我们需要帮助来组织我们的集合,因为我们需要支持对包含 200-3 亿个文档的集合的读写。
我们尝试了几种方法,但无法找到一种简单的方法来实现它。
第一种方法
我们尝试用文档格式的平面集合来解决它:
{
_id: ObjectId("570b3cf65eac4e48e92b4e20"),
mediaId: 10000,
action: "PUBLISH",
occurredOn: ISODate("2016-04-04T12:42:07.000Z")
}
插入很容易,但我们在删除文档时遇到问题。
第二种方法
我们还尝试使用包含操作和日期数组的文档来解决它:
{
_id: 10000,
actions: [
{
action:"PUBLISH",
occurredOn: ISODate("2016-04-04T12:42:07.000Z")
},
...
]
}
插入也很容易,但同样我们在删除文档时遇到问题。
关于如何为这个场景组织模式有什么建议吗?
最佳答案
实际上,这很简单,虽然不是在单个查询中完成。
假设我们有一个集合,它首先存储单个 mediaId 的值,因为这使方法更加清晰。
{ "_id" : ObjectId("570ba4f66931b8f21a8bf25f"), "a" : 3, "date" : ISODate("2016-01-01T00:00:00Z") }
{ "_id" : ObjectId("570ba50a6931b8f21a8bf260"), "a" : 4, "date" : ISODate("2015-01-01T00:00:00Z") }
{ "_id" : ObjectId("570baab36931b8f21a8bf261"), "a" : 5, "date" : ISODate("2014-01-01T00:00:00Z") }
请注意,截至撰写本文时,所有日期均已超过 90 天。
首先,我们要识别最后一个条目的 _id
,无论如何我们都想保留它:
> db.date.find({},{_id:1}).sort({date:-1}).limit(1)
{ "_id" : ObjectId("570ba4f66931b8f21a8bf25f") }
接下来,我们要删除所有超过 90 天且不是最后一个条目的条目:
var outdated = new Date()
outdated.setDate(outdated.getDate() - 90 )
// We check first
db.date.find({
_id:{ $not:{ $eq: ObjectId("570ba4f66931b8f21a8bf25f") }},
date:{ $lt: outdated }
})
这给了我们正确的文件:
{ "_id" : ObjectId("570ba50a6931b8f21a8bf260"), "a" : 4, "date" : ISODate("2015-01-01T00:00:00Z") }
{ "_id" : ObjectId("570baab36931b8f21a8bf261"), "a" : 5, "date" : ISODate("2014-01-01T00:00:00Z") }
所以我们可以运行
> db.date.remove({
_id:{ $not:{ $eq: ObjectId("570ba4f66931b8f21a8bf25f") }},
date:{ $lt: outdated }
})
WriteResult({ "nRemoved" : 2 })
> db.date.find()
{ "_id" : ObjectId("570ba4f66931b8f21a8bf25f"), "a" : 3, "date" : ISODate("2016-01-01T00:00:00Z") }
简单的逻辑。除非另有说明,否则查询条件与逻辑 AND 连接,意味着必须满足所有条件才能匹配文档。因此,即使最后一个文档早于 90 天,它也会被 $not
短语排除。
现在,我们进入正题。
{ "_id" : ObjectId("570baf826931b8f21a8bf262"), "mediaId" : 1000, "date" : ISODate("2016-04-11T14:06:58.668Z") }
{ "_id" : ObjectId("570baf8e6931b8f21a8bf263"), "mediaId" : 1000, "date" : ISODate("2016-01-01T00:00:00Z") }
{ "_id" : ObjectId("570bafa06931b8f21a8bf264"), "mediaId" : 1001, "date" : ISODate("2016-01-01T00:00:00Z") }
{ "_id" : ObjectId("570bafa56931b8f21a8bf265"), "mediaId" : 1001, "date" : ISODate("2015-01-01T00:00:00Z") }
{ "_id" : ObjectId("570bafc96931b8f21a8bf266"), "mediaId" : 1002, "date" : ISODate("2014-01-01T00:00:00Z") }
{ "_id" : ObjectId("570bafcd6931b8f21a8bf267"), "mediaId" : 1002, "date" : ISODate("2013-01-01T00:00:00Z") }
我们必须在这里使用聚合:
db.media.aggregate(
{ $sort:{ date:1 }},
{ $group:{
_id:"$mediaId",
lastId:{ "$last":"$_id" },
}},
{ $group:{
_id:"lastIds",
ids:{ $push:"$lastId" }
}},
{ $project:{ _id: 0, ids: 1 } }
)
让我们剖析一下:
{ $sort:{ date:1 }}
我们想要所有的升序排序{$group:{_id:"$mediaId",lastId:{"$last":"$_id"}}}
我们希望每个 的排序顺序中的最后一个 ObjectId媒体ID
{ $group:{ _id:"lastIds", ids:{ $push:"$lastId"} }}
我们想把所有的 ObjectIds 都放在一个数组中,我们想要一个人工静态 _id
以确保所有 ObjectId 都被推送到所述数组。{ $project:{ _id: 0, ids: 1 } }
我们只想返回所述数组结果是
{
"ids" : [
ObjectId("570baf826931b8f21a8bf262"),
ObjectId("570bafa06931b8f21a8bf264"),
ObjectId("570bafc96931b8f21a8bf266")
]
}
这些是我们明确想要保留的 ObjectId。
你用那些
$in
db.media.find({
_id:{ $not:{ $in:[
ObjectId("570baf826931b8f21a8bf262"),
ObjectId("570bafa06931b8f21a8bf264"),
ObjectId("570bafc96931b8f21a8bf266")
]}},
date:{$lt: outdated}
})
这里的问题是 $in
对于(公认的相当大的)数组来说并不是很好的表现。这对您来说可能就足够了,因为删除似乎并不是时间紧迫的。但是,您也可以通过以下方式删除文档
我们稍微调整了最后一个文档的标识,并为每个要保留的文档添加了批量操作:
var bulk = db.media.initializeUnorderedBulkOp()
db.media.aggregate(
{ $sort:{ date: 1 } },
{ $group:{ _id: "$mediaId", lastId:{ "$last": "$_id" }}}
).forEach(
function(doc){
bulk.find({
_id:{ $not:{ $eq: doc.lastId }},
date:{ $lt: outdated }
}).remove()
}
)
bulk.execute()
恕我直言,这种方法尽可能简单,同时保持良好的性能。
关于MongoDB - 如何删除除最后一个以外的过期文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36547469/
当您在 memcached 中设置 key 过期时,它实际上是在过期时被删除,还是在请求 key 时被删除(get)并且有效期已过。换句话说,过期会自动从 memcached 中删除值,还是简单地将其
Microsoft 是否已将客户端 secret 的有效期更改为最长 2 年?不能再选择“从不”了吗? 最佳答案 我自己也遇到了这个问题。您可以使用Powershell设置添加2年以上的凭据。所以我猜
我正在尝试对我网站上的 csv 文件强制禁止缓存。 我根据 apache 的文档将这些行添加到 httpd.conf: ExpiresActive On ExpiresDefault A0 Expi
我对 Cookie 不熟悉,希望让此 Cookie 在我的注销页面上过期 这是我设置 cookie 的位置: setcookie("loggood", "YES", $expire, "/",
MySQL 是否有某种功能可以在 x 秒后使特定行过期? 例如,我必须以下数据库: users id - integer name - string subscriptions
我的机器上安装了 Matlab Compiler Runtime。它工作正常,但现在当我运行一些需要它的代码时,我得到了这个错误: Failed to initialize MCR Instance:
当我从 PayPal 收到 IPN 时,我不想立即处理它,而是将消息排队,然后使用调度程序处理它。 因此,有一点让我担心 - 如果我将一条消息排队并只处理它(包括'_notify-validate'验
关于 PHP session 过期的问题。 如果该用户有一段时间不活动(出于测试目的,5 秒),我需要我的服务器丢弃 session 信息。 我看过this question尤其是 Gumbo(+28
我有一个 session ,在 30 分钟不活动后或 23.4 小时后被销毁。 我遇到的问题是无论事件如何, session 都会在 30 分钟后被销毁。因此,如果用户在 23.4 小时内一直处于事件
我一直在网上搜索并找到了许多奇怪的答案,而且我几乎尝试了所有这些答案。我的问题是这样的。我的登录页面包含: FormsAuthenticationTicket ticket = new FormsAu
我正在构建一个表单,我必须将数据存储在 HTML5 的 sessionStorage 中 我不知道 sessionStorage 何时过期。谁能告诉我 sessionStorage 的过期时间? 最佳
在我的应用程序中,我有一个必须始终有效的访问 token (Spotify 的)。当此访问 token 过期时,应用必须每 60 分钟刷新一次 token 端点并获取另一个访问 token 。 Aut
我们的办公室有一个简单的闭路电视系统,可以显示我们每个安全摄像头的实时图像。闭路电视系统没有 API 或任何提取实时图像的方法。但是,您可以通过创建带有图像链接的基本 HTML 页面从另一个浏览器查看
我正在基于DotNetOpenAuth实现OAuth2授权/资源服务器。我的服务器将发出生命周期很长的访问 token 。这些 token 将在iOS设备上使用。我看到的流程是这样的:1)要求用户在i
请帮助我在 Varnish 配置中添加过期 header 。 max_age 已在 vcl_fetch 中定义,需要根据 max_age 添加 expires header。 最佳答案 通常不需要设置
我正在开发一个必须使用 session 超时的应用程序。 问题是用户经常错过 session 超时并丢失数据。我已经在 javascript 中实现了一个小型 session 管理器,如果浏览器中有一
我有一个应用程序,可以从我的Instagram帐户中提取数据。 我曾经授权过此应用一次,并获得了访问 token 。但是我很担心 如果该 token 过期怎么办?我是否应该在每次 token 到期?
我在数据表中有多个复选框,它们具有一个名称和不同的值,我可以通过以下代码为所有选中的复选框存储 cookie $(document).ready(function(){ $('i
hibernate 3.3.x、ehcache 2.2.x The following error occurs, when I try to publish a lots of users in a
在 Azure 门户的通知中心的“配置”选项卡上,我能够生成主键和辅助键。我了解这些是获得对 Azure API 的编程访问权限所必需的 - 允许我的客户端应用程序创建注册并发送消息。 谁能解释一下:
我是一名优秀的程序员,十分优秀!