- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我想知道在 MongoDB 中使用索引进行排序实际上是如何工作的。有couple articles在 MongoDB 文档中,但它们实际上并没有描述排序如何进行或时间复杂度。到目前为止,对 SO 和互联网的搜索总体上还没有发现任何相关内容。
假设集合中有一个文档,find() 子句匹配 b 个文档,返回的文档数量有限制,a >> b >> c,并且 c 是一些适当大的数字,使得返回的集合无法容纳内存 - 例如,假设有 1M 个文档。
在操作开始时,存在需要排序的 b 个文档和一个大小为 a 的排序树索引,用于对文档进行排序的特征。
我能想象:
a) 按顺序遍历索引,对于每个ObjectID 遍历b 个文档的列表。返回匹配项,直到达到 c。这将是 O(ab)。
B) 同 A),但首先在 b 文档中构建 ObjectID 的哈希集。这是 O(a),但需要 O(b) 内存。
我试图考虑基于遍历 b 文档集的排序,但似乎无法想出比 O(b log b) 更快的任何东西,这并不比没有索引的排序好。
我假设(但也许我错了)每种排序都不需要索引扫描,那么排序实际上是如何工作的?
更新:
凯文的回答和提供的链接缩小了问题的范围,但我想确认/澄清几点:
$in
一起使用或 $or
查询?例如,假设查询是{a: {$in: [4, 6, 2, 1, 3, 10]}, b: {$gt: 1, $lt: 6}}
a
上有一个复合索引和
b
以该顺序。如果排序在
a
上,排序将如何工作或
b
?
$or
更复杂,因为据我所知,
$or
查询本质上分为多个单独的查询。是
$or
查询总是内存中排序,至少用于合并单独查询的结果?
最佳答案
MongoDB 中的索引存储在 B 树结构中,其中每个索引条目指向磁盘上的特定位置。使用 B 树结构也意味着 MongoDB 索引按排序顺序存储,始终按顺序遍历,并且 MongoDB 通过索引按排序顺序获取一系列文档的成本很低。
更新 :B-tree 结构对于 MMAPv1 存储引擎是正确的,但 WiredTiger 存储引擎的实现略有不同(自 MongoDB 3.2 起默认)。基本思想保持不变,以排序顺序遍历索引的成本很低。
一个 SORT
查询中的阶段(即内存中排序)限制为 32MB 的内存使用。如果 SORT
查询将失败阶段超过此限制。这个限制可以通过利用索引的排序特性来回避,这样 MongoDB 就可以返回一个带有 sort()
的查询。参数而不执行内存中的排序。
让我们假设查询的形状是:
db.a.find({b:{$gt:100}, c:{$gt:200}}).sort(...)
a
有一个索引:
db.a.createIndex({b:1,c:1})
sort()
出现时,有两种可能的情况。阶段在查询中指定:
SORT
舞台 .
db.a.find({b:{$gt:100}, c:{$gt:200}}).sort({c:1})
{b:1,c:1}
可用于:
b
的文档{b:{$gt:100}}
大于 100查询的一部分。 c
排序。 . explain()
此查询的输出将具有
SORT
阶段。此
SORT
stage 将被限制为 32MB 的内存使用。
{b:1,c:1}
可用于 sort({b:1,c:1})
或 sort({b:-1,c:-1})
但不能用于 sort({b:1,c:-1})
) db.a.find({b:{$gt:100}, c:{$gt:200}}).sort({b:1})
{b:1,c:1}
可用于:
b
的文档{b:{$gt:100}}
大于 100查询的一部分。 b
进行排序。 . explain()
上述查询的输出将
不是 有一个
SORT
阶段。另外,
explain()
带有和不带有
sort()
的查询输出是相同的。本质上,我们得到了
sort()
免费。
SORT
查询阶段db.a.find({a:1}).sort({b:1})
a
和 b
同时字段;例如复合索引,例如 {a:1,b:1}
是必须的。您不能有两个单独的索引 {a:1}
和 {b:1}
,并期待 {a:1}
用于相等部分的索引,以及 {b:1}
用于排序部分的索引。在这种情况下,MongoDB 将选择两个索引之一。db.a.find({}).sort({a:1})
{a:1,b:1}
可用于排序部分(因为您基本上要返回整个集合)。如果您的查询如下所示:db.a.find({a:1}).sort({b:1})
{a:1,b:1}
也可用于查询的两个部分。还:db.a.find({a:1,b:1})
{a:1,b:1}
find()
其次是 sort()
参数遵循索引顺序{a:1,b:1}
.因此复合索引必须按 排序相等 -> 排序 . a
在一个文档中是字符串,在其他文档中是数字,在另一个文档中是 bool 值),排序如何进行?
关于mongodb - 在 MongoDB 中如何使用索引进行排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36142299/
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset,并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
我已经创建了 MongoDB Atlas 帐户,并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息),任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息,有人可以帮忙吗? 我试过提供的解决方案 here但没有帮助。 最佳答案 我建议执行以下操作: 按 Wi
我对 MongoDB 和 MongoDB Compass 非常陌生。 我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。 非常感谢, 最佳答案 您可以使用 Mo
当我尝试在我的 Ubuntu 机器中安装 mongodb 时,apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例? 最佳答案 确保 Meteor 正在本地主机上运行。打开终端窗口并运行
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
我如何在 mongos mapreduce 中指定一个条件,就像我们在 mongos group 函数中所做的那样。 我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引,这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
在我的数据库中,每个包含项目的文档中都有一个嵌套的元素数组,格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
我正在构建一个应用程序,其中用户可以位于不同的时区,并且我运行的查询对他们的时区很敏感。 我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
我正在研究使用 mongodb 进行分片,我有以下结构: 1 个 Mongod 到我的 ConfigServer,在 ReplicaSet 中只有 1 个成员 2 个分片,每个分片在 ReplicaS
我正在尝试获取一个 mongoDB 对象,例如 Friend1 包含另一个 mongoDB 对象 Friend2,该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。 要么这样,要么
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。 我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9,最终我想升级到 2.4.9,但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件,然后是
目前,我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接,该 PC 也运行 vm。 这是两台电脑的
我创建了一个免费的 mongodb 集群。我创建了一个用户,设置了与 mongodb compass 的连接,复制了连接字符串,然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde
我是一名优秀的程序员,十分优秀!