- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Mongo 数据库版本 3.4.6
我有一个文档结构类似于以下内容的集合:
{
organization: "ABC123",
tags: ["MARTHA WASHINGTON", "+15552082000"],
updatedAt : ISODate("2020-10-09T17:19:44.861Z"),
createdAt : ISODate("2020-01-14T19:46:15.957Z"),
}
我需要能够按组织进行查询,并在标签数组上使用“开头为”的正则表达式,并可选择按 updatedAt 或 createdAt 进行排序。为此,我创建了以下索引:
{
"organization" : 1,
"tags" : 1,
"createdAt" : -1
}
这是一个多键复合索引,根据我对 Mongo 的理解,它应该允许我涵盖所有情况下的查询。如果我执行如下查询:
db.getCollection('data').find({"organization": "ABC123", "search": /^MARTHA WASHINGTO/})
查询包含在索引中 - 我看到一个 FETCH/IXSCAN 阶段。
同样,如果我删除正则表达式查询并添加排序 - 查询将被完美覆盖。
db.getCollection('data').find({"organization": "ABC123", "search": "MARTHA WASHINGTON"}).sort({"createdAt":-1})
但是,如果我组合正则表达式和排序选项,我突然会在查询中看到一个额外的 SORT 阶段。示例查询:
db.getCollection('data').find({"organization": "ABC123", "search": /^MARTHA WASHINGTO/}).sort({"createdAt":-1})
这是解释的获胜计划输出:
"winningPlan" : {
"stage" : "SORT",
"sortPattern" : {
"createdAt" : -1.0
},
"inputStage" : {
"stage" : "SORT_KEY_GENERATOR",
"inputStage" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"organization" : 1,
"tags" : 1,
"createdAt" : -1
},
"indexName" : "tag matches by organization",
"isMultiKey" : true,
"multiKeyPaths" : {
"organization" : [],
"search" : [
"search"
],
"createdAt" : []
},
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 2,
"direction" : "forward",
"indexBounds" : {
"organization" : [
"[\"ABC123\", \"ABC123\"]"
],
"tags" : [
"[\"MARTHA WASHINGTON\", \"MARTHA WASHINGTOO\")",
"[/^MARTHA WASHINGTON/, /^MARTHA WASHINGTON/]"
],
"createdAt" : [
"[MaxKey, MinKey]"
]
}
}
}
}
},
我很困惑为什么这个查询组合没有被索引覆盖。我的理解是,开始时额外的排序阶段会导致大型集合的性能下降。谁能提供一些指导?我错过了一些限制吗?
更新:移除正则表达式查询时的获胜方案
"winningPlan" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"organization" : 1,
"search" : 1,
"createdAt" : -1
},
"indexName" : "tag matches by organization",
"isMultiKey" : true,
"multiKeyPaths" : {
"organization" : [],
"search" : [
"search"
],
"createdAt" : []
},
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 2,
"direction" : "forward",
"indexBounds" : {
"organization" : [
"[\"ABC123\", \"ABC123\"]"
],
"tags" : [
"[\"MARTHA WASHINGTON\", \"MARTHA WASHINGTON\"]"
],
"createdAt" : [
"[MaxKey, MinKey]"
]
}
}
},
最佳答案
另一个答案不太准确。来自docs
For case sensitive regular expression queries, if an index exists for the field, then MongoDB matches the regular expression against the values in the index, which can be faster than a collection scan.
Mongo 能够使用带正则表达式的索引,显然,如果您的正则表达式是后缀正则表达式,那么集合扫描实际上可能更快,因为 Mongo 必须读取整个索引树才能满足需求。
那么您的查询中发生了什么?为什么获胜的计划是 sort
?好吧,虽然它实际上可能是获取结果的最佳方式,但也有可能 Mongo 只是选择了错误的计划。
首先让我们了解 Mongo 如何选择获胜计划,计划评估是基于比较给定查询的候选计划,看看哪个返回第一批结果(默认为 101 个文档),总体“工作量”最少.工作分数代表查询阶段(索引键比较、获取文档等)中涉及的不同工作。如果多个计划在评估期间执行相同的工作,则有一些小的打破平局的奖金可以帮助选择一个计划来缓存。基本上 Mongo 会进行一场小型“比赛”并等待谁获胜。
因此,在您的情况下,由于具有索引的正则表达式性质,sort
阶段获胜,如果您完全运行计划而不是小样本,则可能会选择不同的计划。
我建议您使用 hint 进行自己的测试,这会强制 Mongo 使用某个索引,这意味着您可以强制 Mongo 为您的查询制定获胜计划。我个人认为(显然依赖于特定的正则表达式)您可以通过这样做来提高性能,因为首先排序几乎不是每一个“最佳”计划。
关于具有复杂查询的 MongoDB 索引覆盖率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64285321/
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset,并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
我已经创建了 MongoDB Atlas 帐户,并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息),任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息,有人可以帮忙吗? 我试过提供的解决方案 here但没有帮助。 最佳答案 我建议执行以下操作: 按 Wi
我对 MongoDB 和 MongoDB Compass 非常陌生。 我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。 非常感谢, 最佳答案 您可以使用 Mo
当我尝试在我的 Ubuntu 机器中安装 mongodb 时,apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例? 最佳答案 确保 Meteor 正在本地主机上运行。打开终端窗口并运行
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
我如何在 mongos mapreduce 中指定一个条件,就像我们在 mongos group 函数中所做的那样。 我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引,这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
在我的数据库中,每个包含项目的文档中都有一个嵌套的元素数组,格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
我正在构建一个应用程序,其中用户可以位于不同的时区,并且我运行的查询对他们的时区很敏感。 我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
我正在研究使用 mongodb 进行分片,我有以下结构: 1 个 Mongod 到我的 ConfigServer,在 ReplicaSet 中只有 1 个成员 2 个分片,每个分片在 ReplicaS
我正在尝试获取一个 mongoDB 对象,例如 Friend1 包含另一个 mongoDB 对象 Friend2,该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。 要么这样,要么
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。 我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9,最终我想升级到 2.4.9,但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件,然后是
目前,我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接,该 PC 也运行 vm。 这是两台电脑的
我创建了一个免费的 mongodb 集群。我创建了一个用户,设置了与 mongodb compass 的连接,复制了连接字符串,然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde
我是一名优秀的程序员,十分优秀!