mongodb - 在 MongoDB 中如何使用索引进行排序？-6ren

mongodb - 在 MongoDB 中如何使用索引进行排序？

转载作者：IT老高更新时间：2023-10-28 13:10:01

26

4

我想知道在 MongoDB 中使用索引进行排序实际上是如何工作的。有couple articles在 MongoDB 文档中，但它们实际上并没有描述排序如何进行或时间复杂度。到目前为止，对 SO 和互联网的搜索总体上还没有发现任何相关内容。

假设集合中有一个文档，find() 子句匹配 b 个文档，返回的文档数量有限制，a >> b >> c，并且 c 是一些适当大的数字，使得返回的集合无法容纳内存 - 例如，假设有 1M 个文档。

在操作开始时，存在需要排序的 b 个文档和一个大小为 a 的排序树索引，用于对文档进行排序的特征。

我能想象:

a) 按顺序遍历索引，对于每个ObjectID 遍历b 个文档的列表。返回匹配项，直到达到 c。这将是 O(ab)。

B) 同 A)，但首先在 b 文档中构建 ObjectID 的哈希集。这是 O(a)，但需要 O(b) 内存。

我试图考虑基于遍历 b 文档集的排序，但似乎无法想出比 O(b log b) 更快的任何东西，这并不比没有索引的排序好。

我假设(但也许我错了)每种排序都不需要索引扫描，那么排序实际上是如何工作的？

更新:

凯文的回答和提供的链接缩小了问题的范围，但我想确认/澄清几点:

据我了解，如果您想避免内存中排序，则不能对查询和排序使用不同的索引。当我阅读 this page看起来好像你可以(或者至少，它没有指定一种或另一种方式)，但这似乎是不正确的。本质上，对文档进行排序是因为它们在查询期间按照索引的顺序进行查找，因此按照索引的顺序返回。对？

查询复合索引时，排序索引必须是复合索引中的第一个索引，查询是等式的索引除外。如果不是，则在内存中执行排序。对？

排序如何与 $in 一起使用或 $or查询？例如，假设查询是
{a: {$in: [4, 6, 2, 1, 3, 10]}, b: {$gt: 1, $lt: 6}}

... a 上有一个复合索引和 b以该顺序。如果排序在 a 上，排序将如何工作或 b ? $or更复杂，因为据我所知， $or查询本质上分为多个单独的查询。是 $or查询总是内存中排序，至少用于合并单独查询的结果？

最佳答案

MongoDB 中的索引存储在 B 树结构中，其中每个索引条目指向磁盘上的特定位置。使用 B 树结构也意味着 MongoDB 索引按排序顺序存储，始终按顺序遍历，并且 MongoDB 通过索引按排序顺序获取一系列文档的成本很低。

更新 :B-tree 结构对于 MMAPv1 存储引擎是正确的，但 WiredTiger 存储引擎的实现略有不同(自 MongoDB 3.2 起默认)。基本思想保持不变，以排序顺序遍历索引的成本很低。

一个 SORT查询中的阶段(即内存中排序)限制为 32MB 的内存使用。如果 SORT 查询将失败阶段超过此限制。这个限制可以通过利用索引的排序特性来回避，这样 MongoDB 就可以返回一个带有 sort() 的查询。参数而不执行内存中的排序。

让我们假设查询的形状是:

    db.a.find({b:{$gt:100}, c:{$gt:200}}).sort(...)

带收藏 a有一个索引:

    db.a.createIndex({b:1,c:1})

当 sort() 出现时，有两种可能的情况。阶段在查询中指定:

1. MongoDB 不能使用索引的排序特性，必须在内存中执行 SORT舞台 .

如果查询不能使用“索引前缀”，这就是结果。例如:

    db.a.find({b:{$gt:100}, c:{$gt:200}}).sort({c:1})

在上面的查询中，索引 {b:1,c:1}可用于:

匹配具有 b 的文档{b:{$gt:100}} 大于 100查询的一部分。

但是，不能保证返回的文档按 c 排序。 .

因此，MongoDB别无选择，只能执行内存中排序。 explain()此查询的输出将具有 SORT阶段。此 SORT stage 将被限制为 32MB 的内存使用。

2、MongoDB可以利用索引的排序性质 .

这是查询使用的结果:

匹配索引顺序的排序键，以及

指定与索引相同的顺序(即索引 {b:1,c:1} 可用于 sort({b:1,c:1}) 或 sort({b:-1,c:-1}) 但不能用于 sort({b:1,c:-1}) )

例如:

    db.a.find({b:{$gt:100}, c:{$gt:200}}).sort({b:1})

在上面的查询中，索引 {b:1,c:1}可用于:

匹配具有 b 的文档{b:{$gt:100}} 大于 100查询的一部分。

在这种情况下，MongoDB 可以保证返回的文档按照 b 进行排序。 .

explain()上述查询的输出将不是有一个 SORT阶段。另外， explain()带有和不带有 sort() 的查询输出是相同的。本质上，我们得到了 sort()免费。

理解这个主题的一个有值(value)的资源是 Optimizing MongoDB Compound Indexes .请注意，这篇博文写于 2012 年。虽然一些术语可能已经过时，但文章的技术性仍然相关。

后续问题更新

MongoDB 使用 only one index for most queries .例如，为了避免内存中 SORT查询阶段

db.a.find({a:1}).sort({b:1})

索引必须同时涵盖 a和 b同时字段；例如复合索引，例如 {a:1,b:1}是必须的。您不能有两个单独的索引 {a:1}和 {b:1} ，并期待 {a:1}用于相等部分的索引，以及 {b:1}用于排序部分的索引。在这种情况下，MongoDB 将选择两个索引之一。

因此，对结果进行排序是正确的，因为它们是按照索引的顺序查找和返回的。

为了避免使用复合索引进行内存中排序，索引的第一部分必须满足查询的相等部分，第二部分必须满足查询的排序部分(如 ( 1) 以上)。

如果您有这样的查询:

db.a.find({}).sort({a:1})

指数{a:1,b:1}可用于排序部分(因为您基本上要返回整个集合)。如果您的查询如下所示:

db.a.find({a:1}).sort({b:1})

同指数{a:1,b:1}也可用于查询的两个部分。还:

db.a.find({a:1,b:1})

也可以使用相同的索引 {a:1,b:1}
注意这里的模式:find()其次是 sort()参数遵循索引顺序{a:1,b:1} .因此复合索引必须按 排序相等 -> 排序 .

关于不同类型排序的更新

如果文档之间的字段具有不同的类型(例如，如果 a 在一个文档中是字符串，在其他文档中是数字，在另一个文档中是 bool 值)，排序如何进行？

答案是 MongoDB BSON type comparison order .解释一下手册页，顺序是:

MinKey(内部类型)

空

数字(整数、长整数、 double 数、小数)

符号、字符串

对象

数组

BinData

对象 ID

bool

日期

时间戳

正则表达式

MaxKey(内部类型)

所以从上面使用升序的例子来看，包含数字的文档将首先出现，然后是字符串，然后是 bool 值。

关于mongodb - 在 MongoDB 中如何使用索引进行排序？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36142299/

26

4

0

文章推荐： go - Go 函数参数中下划线的含义

文章推荐： go - 自定义类型作为参数传递给函数

文章推荐： android - 如何启用 Google Play 应用签名

mongodb - 使用 mongodb+srv 连接到部署为有状态集的 mongodb
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset，并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
mongodb - 如何使用 MongoDB Atlas 连接 MongoDB
我已经创建了 MongoDB Atlas 帐户，并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
mongodb - JsonLD+MongoDB : Store JsonLD in MongoDB
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息)，任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
mongodb - 服务 'MongoDB Server' (MongoDB) 启动失败
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息，有人可以帮忙吗？我试过提供的解决方案 here但没有帮助。最佳答案我建议执行以下操作: 按 Wi
mongodb - 如何使用 MongoDB 指南针删除 MongoDB 集合中选定的多条记录
我对 MongoDB 和 MongoDB Compass 非常陌生。我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。非常感谢，最佳答案您可以使用 Mo
mongodb - mongodb 和 mongodb-server 的区别
当我尝试在我的 Ubuntu 机器中安装 mongodb 时，apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
mongodb - 如何将 mongodb 客户端连接到本地 Meteor MongoDB
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例？最佳答案确保 Meteor 正在本地主机上运行。打开终端窗口并运行
mongodb - 频率表生成 - MongoDB
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
mongodb - mongodb mapreduce中的where条件
我如何在 mongos mapreduce 中指定一个条件，就像我们在 mongos group 函数中所做的那样。我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
mongodb - 从 mongodb shell 运行具有 mongodb 查询的脚本
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引，这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
mongodb - 比较嵌套数组中的对象 - mongoDB
在我的数据库中，每个包含项目的文档中都有一个嵌套的元素数组，格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
mongodb - MongoDB 上的时区查询
我正在构建一个应用程序，其中用户可以位于不同的时区，并且我运行的查询对他们的时区很敏感。我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
mongodb - 为什么当我添加新集合时只有一个分片获取数据？ - MongoDB
我正在研究使用 mongodb 进行分片，我有以下结构: 1 个 Mongod 到我的 ConfigServer，在 ReplicaSet 中只有 1 个成员 2 个分片，每个分片在 ReplicaS
mongodb - mongoDB 中是否可以使用循环对象引用？
我正在尝试获取一个 mongoDB 对象，例如 Friend1 包含另一个 mongoDB 对象 Friend2，该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。要么这样，要么
mongodb - 通过命令行正确卸载 MongoDB
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
mongodb - 无法通过终端使用身份验证数据连接 mongodb
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
mongodb - 当配置实例使用与数据实例相同的二进制文件时升级 Mongodb
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9，最终我想升级到 2.4.9，但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件，然后是
mongodb - 无法远程连接到 mongodb
目前，我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接，该 PC 也运行 vm。这是两台电脑的
mongodb - 如何从 mongodb compass 连接 mongodb 集群？
我创建了一个免费的 mongodb 集群。我创建了一个用户，设置了与 mongodb compass 的连接，复制了连接字符串，然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
mongodb - MongoDB 索引名称
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde

首页

博学

6Ren·AI

商城

mongodb - 在 MongoDB 中如何使用索引进行排序？