gpt4 book ai didi

mongodb - MongoDB 查询速度过慢,即使查询很简单并且与索引对齐

转载 作者:IT老高 更新时间:2023-10-28 13:11:44 27 4
gpt4 key购买 nike

我正在运行一个 MongoDB 服务器(实际上就是它所运行的全部内容)。该服务器具有 64GB 的 RAM 和 16 个内核,以及 2TB 的硬盘空间可供使用。

文档结构

该数据库有一个集合 domains,其中包含大约 2000 万个文档。每个文档中都有相当数量的数据,但出于我们的目的,该文档的结构如下:

{
_id: "abcxyz.com",
LastUpdated: <date>,
...
}

_id 字段是文档引用的域名。 LastUpdated 上有一个升序索引。 LastUpdated 每天更新数十万条记录。基本上,每次文档有新数据可用时,文档都会更新,并且 LastUpdated 字段会更新为当前日期/时间。

查询

我有一种从数据库中提取数据的机制,以便可以在 Lucene 索引中对其进行索引。 LastUpdated 字段是标记对文档所做更改的关键驱动程序。为了搜索已更改的文档并翻阅这些文档,我执行以下操作:

{
LastUpdated: { $gte: ISODate(<firstdate>), $lt: ISODate(<lastdate>) },
_id: { $gt: <last_id_from_previous_page> }
}

sort: { $_id:1 }

当没有文档返回时,开始和结束日期向前移动,_id“ anchor ”字段被重置。此设置允许以前页面中的文档更改了 LastUpdated 值,即分页不会被以前页面中的文档数量错误地抵消,这些文档现在在技术上不再在这些页面中。

问题

我希望一次选择大约 25000 个文档,但由于某种原因,查询本身(即使只选择 <500 个文档)非常慢。

我运行的查询是:

db.domains.find({
"LastUpdated" : {
"$gte" : ISODate("2011-11-22T15:01:54.851Z"),
"$lt" : ISODate("2011-11-22T17:39:48.013Z")
},
"_id" : { "$gt" : "1300broadband.com" }
}).sort({ _id:1 }).limit(50).explain()

事实上,解释(在撰写本文时)已经运行了 10 多分钟并且尚未完成,这实在是太慢了。如果它完成了,我会更新这个问题,但问题当然是查询非常慢。

我能做什么?我不知道查询可能存在什么问题。

编辑讲解在 55 分钟后结束。这里是:

{
"cursor" : "BtreeCursor Lastupdated_-1__id_1",
"nscanned" : 13112,
"nscannedObjects" : 13100,
"n" : 50,
"scanAndOrder" : true,
"millis" : 3347845,
"nYields" : 5454,
"nChunkSkips" : 0,
"isMultiKey" : false,
"indexOnly" : false,
"indexBounds" : {
"LastUpdated" : [
[
ISODate("2011-11-22T17:39:48.013Z"),
ISODate("2011-11-22T15:01:54.851Z")
]
],
"_id" : [
[
"1300broadband.com",
{

}
]
]
}
}

最佳答案

碰到一个非常相似的问题,Indexing Advice and FAQ Mongodb.org 上说,引用:

The range query must also be the last column in an index

因此,如果您有键 a、b 和 c 并运行 db.ensureIndex({a:1, b:1, c:1}),这些是“指南”,以便尽可能多地使用索引:

好:

  • 找到(a=1,b>2)

  • find(a>1 和 a<10)

  • find(a>1 and a<10).sort(a)

不好:

  • 找到(a>1, b=2)

Only use a range query OR sort on one column. Good:

  • find(a=1,b=2).sort(c)

  • 找到(a=1,b>2)

  • 查找(a=1,b>2 和 b<4)

  • find(a=1,b>2).sort(b)

不好:

  • 找到(a>1,b>2)

  • find(a=1,b>2).sort(c)

希望对你有帮助!

/J

关于mongodb - MongoDB 查询速度过慢,即使查询很简单并且与索引对齐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8250172/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com