MongoDB 获取文档速度慢(使用索引)-6ren

MongoDB 获取文档速度慢(使用索引)

转载作者：IT老高更新时间：2023-10-28 12:31:25

FETCH 阶段是我查询的限制因素。我一直在研究，似乎 mongodb 的阅读量远远超过了它的需要，并且没有充分利用带宽。

我的 mongoDB-mongod 实例似乎在单个查询中读取了很多内容。在附加了 1 个 EBS io 5000Piops (100GB) SSD 的 AWS EC2 m4.xlarge 上进行测试。16 GB 内存。

native 仅包含用于测试目的的 mongodb 实例。
数据库总共大约 60GB(在磁盘上)(几个集合)。
主要集合用于以下场景和查询。

数据库统计

db.stats()
{
    "db" : "database",
    "collections" : 4,
    "objects" : 406496932,
    "avgObjSize" : 326.3196544642064,
    "dataSize" : 132647938391,
    "storageSize" : 55475830784,
    "numExtents" : 0,
    "indexes" : 5,
    "indexSize" : 8940408832,
    "ok" : 1
 }

收藏摘要:

db.collection.stats()  ->  
{    "ns" : "database.[collection###]",
    "count" : 367614513,
    "size" : 121155225858,
    "avgObjSize" : 329,
    "storageSize" : 52052197376,
    "capped" : false,
    "wiredTiger" : {"Left empty"},
    "nindexes" : 2,
    "totalIndexSize" : 8131604480,
    "indexSizes" : {
            "_id_" : 4373012480,
            "id_1_ts_-1" : 3758592000
    },
    "ok" : 1

查询:

db.[#######].find({ id : "######", 
   ts : { 
    "$gte" :
       ISODate("2016-10-01T00:00:00.000Z"), 
     $lt :
       ISODate("2016-10-07T02:00:00.000Z")
}}, {_id : 0,"u1"
     :1,"u2":1,"u3":1,"eq1" :1 ,"eq2" : 1,"eq3": 1,"ts" :1});

以及解释结果:

{
    "queryPlanner" : {
            "plannerVersion" : 1,
            "namespace" : "database.[collection]",
            "d" : false,
            "parsedQuery" : {
                    "$and" : [
                            {
                                    "id" : {
                                            "$eq" : "#####ID#####"
                                    }
                            },
                            {
                                    "ts" : {
                                            "$lt" : ISODate("2016-09-30T22:00:00Z")
                                    }
                            },
                            {
                                    "ts" : {
                                            "$gte" : ISODate("2016-09-22T22:00:00Z")
                                    }
                            }
                    ]
            },
            "winningPlan" : {
                    "stage" : "PROJECTION",
                    "transformBy" : {
                            "_id" : 0,
                            "u1" : 1,
                            "u2" : 1,
                            "u3" : 1,
                            "eq1" : 1,
                            "eq2" : 1,
                            "eq3" : 1,
                            "ts" : 1
                    },
                    "inputStage" : {
                            "stage" : "FETCH",
                            "inputStage" : {
                                    "stage" : "IXSCAN",
                                    "keyPattern" : {
                                            "id" : 1,
                                            "ts" : -1
                                    },
                                    "indexName" : "id_1_ts_-1",
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : false,
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "id" : [
                                                    "[\"#####ID#####\", \"#####ID#####\"]"
                                            ],
                                            "ts" : [
                                                    "(new Date(1475272800000), new Date(1474581600000)]"
                                            ]
                                    }
                            }
                    }
            },
            "rejectedPlans" : [ ]
    },
    "executionStats" : {
            "executionSuccess" : true,
            "nReturned" : 676745,
            "executionTimeMillis" : 170508,
            "totalKeysExamined" : 676745,
            "totalDocsExamined" : 676745,
            "executionStages" : {
                    "stage" : "PROJECTION",
                    "nReturned" : 676745,
                    "executionTimeMillisEstimate" : 167820,
                    "works" : 676746,
                    "advanced" : 676745,
                    "needTime" : 0,
                    "needYield" : 0,
                    "saveState" : 8970,
                    "restoreState" : 8970,
                    "isEOF" : 1,
                    "invalidates" : 0,
                    "transformBy" : {
                            "_id" : 0,
                            "u1" : 1,
                            "u2" : 1,
                            "u3" : 1,
                            "eq1" : 1,
                            "eq2" : 1,
                            "eq3" : 1,
                            "ts" : 1
                    },
                    "inputStage" : {
                            "stage" : "FETCH",
                            "nReturned" : 676745,
                            "executionTimeMillisEstimate" : 166470,
                            "works" : 676746,
                            "advanced" : 676745,
                            "needTime" : 0,
                            "needYield" : 0,
                            "saveState" : 8970,
                            "restoreState" : 8970,
                            "isEOF" : 1,
                            "invalidates" : 0,
                            "docsExamined" : 676745,
                            "alreadyHasObj" : 0,
                            "inputStage" : {
                                    "stage" : "IXSCAN",
                                    "nReturned" : 676745,
                                    "executionTimeMillisEstimate" : 980,
                                    "works" : 676746,
                                    "advanced" : 676745,
                                    "needTime" : 0,
                                    "needYield" : 0,
                                    "saveState" : 8970,
                                    "restoreState" : 8970,
                                    "isEOF" : 1,
                                    "invalidates" : 0,
                                    "keyPattern" : {
                                            "id" : 1,
                                            "ts" : -1
                                    },
                                    "indexName" : "id_1_ts_-                                                                   1",
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : false,
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "id" : [
                                                    "[\"#####ID#####\", \"#####ID#####\"]"
                                            ],
                                            "ts" : [
                                                    "(new Date(1475272800000), new Date(1474581600000)]"
                                            ]
                                    },
                                    "keysExamined" : 676745,
                                    "dupsTested" : 0,
                                    "dupsDropped" : 0,
                                    "seenInvalidated" : 0
                            }
                    }
            },
            "allPlansExecution" : [ ]
    },
    "serverInfo" : {
            "host" : "ip #########",
            "port" : 27017,
            "version" : "3.2.10",
            "gitVersion" : "79d9b3ab5ce20f51c272b4411202710a082d0317"
    },
    "ok" : 1

}

正如我们在上面看到的 mongoDb 使用索引。 IXSCAN 需要 980ms 并且获取 ~160000ms。

如果我没记错的话，整个读取应该是 676746(nReturned) * 329(avgObjSize) Bytes = ~212 MB 数据。

我注意到在 iostats (http://linuxcommand.org/man_pages/iostat1.html) 中(/data/db 在 xvdf 上):

  vg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.27    0.00    0.00   21.35    0.13   78.25
Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
xvda              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
xvdf              0.00     0.00 1691.00    0.00    19.83     0.00    24.02     0.95    0.56    0.56    0.00   0.56  94.40

rMB/s 表示 ~20MB/s，并且在整个操作(获取阶段)期间是连续的。这意味着 mongodb 正在读取 160 s * 20MB/s = 3 200 MB，远远超过上面的 200 MB。

内存:

    free -m
             total       used       free     shared    buffers     cached
   Mem:         16048      12629       3418          0         32       4071
   -/+ buffers/cache:       8525       7522
  Swap:            0          0

mongodb 也没有使用 5000 iops EBS 配置，也没有 promise 的带宽？仅使用 ~1700 读取/秒导致 ~20MB/s。

我已将预读更改为 16KB。我试过将日志和日志放在另一个硬盘上。

我想不通!帮我。请!

最佳答案

我在获取大约 35000 个文档时遇到了同样的问题。为了解决这个问题，我使用了聚合函数 (sakulstra:aggregate)，就我而言，它极大地提升了请求。结果格式显然不一样，但它仍然很容易用于计算我需要的所有东西。

之前(7000 毫秒):

const historicalAssetAttributes = HistoricalAssetAttributes.find({
        date:{'$gte':startDate,'$lte':endDate},
        assetId: {$in: assetIds}
    }, {
        fields:{
            "date":1,
            "assetId":1,
            "close":1
        }
    }).fetch();

之后(300 毫秒):

const historicalAssetAttributes = HistoricalAssetAttributes.aggregate([
        {
            '$match': {
                date: {'$gte': startDate, '$lte': endDate},
                assetId: {$in: assetIds}
            }
        }, {
            '$group':{
                _id: {assetId: "$assetId"},
                close: {
                    '$push': {
                        date: "$date",
                        value: "$close"
                    }
                }
            }
        }
    ]);

关于MongoDB 获取文档速度慢(使用索引)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40306901/

文章推荐： python - 在 Python 中转义 HTML 的最简单方法是什么？

文章推荐： C# Mongodb FindOneAndReplace 或 ReplaceOne 不起作用

mysql - 查询未使用正确的索引，速度慢
我的应用程序中有以下查询: SELECT a.*, f.* FROM flights_database f JOIN airports a ON f.airport = a.airportNameCl
MySQL 速度慢，表中有大文本字段
我们在使用 MySQL(以及 MariaDB)时遇到了一个奇怪的问题。一个简单的数据库，有 2 个表(InnoDB 引擎)，都包含(以及其他一些)3 或 4 个带有 XML 数据的文本列。大小为 1-
MySql执行路径突然变化很大，不一致，速度慢
我在 MySQL 上的执行路径上遇到问题，导致查询缓慢且不一致。这是一个全新的现象。我们还有其他具有完全相同(好吧，尽可能接近)设置的表，这很好，但出于某种原因，现在创建新表会遇到这个缓慢/不一致的问
Eclipse Marketplace 速度慢，如何加快速度？
我使用 Eclipse Marketplace 的下载速度始终非常慢(现在从 http://download.eclipse.org 开始，下载速度为 3 MB/s，下载速度为 25 kB/s)，这使
Qt Creator 速度慢，因为包含很多
我正在开发一个 Qt Creator 项目，其中包含大量头文件(点云库、Boost 等)。例如。 Boost 有大约 9000 个头文件。现在看来，包含的数量确实减慢了 IDE。代码完成很慢，大约。
javascript - document.elementFromPoint 速度慢
我在一个项目中使用 document.elementFromPoint，它看起来很慢。 100,000 次迭代需要 7051 毫秒。 document.getElementsByTagName("*"
ios - 滚动 UITableView 速度慢
我有一个 tableView ，每行有四个图表，大约 20 行。当我尝试滚动表格时，我将删除现有图表并为每一行构建新图表。此操作使 TableView 的滚动非常慢。任何使滚动速度更快以及加载新图表
python - 日期时间转换 - pandas 速度慢
我有一个如下所示的数据框: date,time,metric_x 2016-02-27,00:00:28.0000000,31 2016-02-27,00:01:19.0000000,40 2016-
android - 以编程方式设置微调器文本颜色滞后，速度慢，瞬间颜色错误
TLDR:我的微调器瞬间显示了错误的颜色。我的微调器有问题。每当我运行应用程序时，如果 Activity 没有缓存在内存中，它有时会滞后。在我可以将其设置为正确的颜色之前，文本是默认颜色(如黑色)。
SQLite:大表上的 COUNT 速度慢
我在使用 SELECT COUNT(*) 对大型表进行 SQLite 时遇到性能问题。由于我还没有收到可用的答案并且我做了一些进一步的测试，所以我编辑了我的问题以纳入我的新发现。我有 2 个表:
javascript - 当音频因加载数据不足(速度慢)而暂停时，我可以使用什么事件？
当音频因加载数据不足(速度慢)而暂停时，我可以使用什么事件？就像: $audio.on('suspendToLoading',function(){ alert('loading...');
excel - MATLAB 中 xlsread 速度慢
这是我的 MATLAB 程序的分析模拟运行结果。我需要运行此模拟数十万次(约 100,000 次)。因此我需要一种更快的方法来读取 Excel 文件。规范:Excel 文件由 10000x2 个单
excel - Excel 数据透视表 MDX 速度慢？
每当与数据透视表交互时，Excel 都非常慢，这让我感到非常困难。添加/删除字段、更改过滤器或切片器，所有这些都需要 Excel 卡住几分钟才能响应。看来生成的 MDX 效率极低。我可以理解他们必须
sql - 大型数据集的 Entity Framework 速度慢
我正在使用 Entity Framework 来检索大型数据集。数据集有parent/child关系，我需要和parent同时带回child信息。我发现 EF 最初发送一个查询以获取父对象列表，然
c# - Gridview 上的 DataBind() 速度慢
我有一个使用 gridview 的应用程序，它非常慢。添加 Trace=true 后对于页面，我追踪了时间花费的地方:在 GridView 上调用 BindData() 时。 GridView连接到
c++ - QGraphicsView 速度慢，有很多 QGraphicsPixmapItem
我编写了一个小代码来使用 QtCreator 测试 QGraphicsView 的功能。代码非常简单，只是创建了一个继承自 QGraphicsView 的类，上面有一个 QGraphicsScene
php - 成员(member)表格自动补充，速度慢
后期以补充作品的形式自动加入成员(member)。数据库速度较慢。有没有办法加快这个速度？用户无所谓..除了自动补码之外如何停止写？(自动补码；城市输入。成员(member)表格位于。) 注册.php
mysql - MYSQL 插入数据库 MyISAM 速度慢
我有一个文件 (insert.sql)，其中有 250k 行，没有键，没有索引: INSERT `project_383`.`entity_metrics_build_1` VALUES ('d402
java - SQL 速度慢，需要帮助。我应该走进内存吗？
我最近开发了一个应用程序(java 8、spring-boot、hibernate、maven)，它通过 REST API 公开数据库。我遇到的问题是数据库调用很慢(3000 毫秒以上)，只是为了获取
javascript - 旋转 HTML5 Canvas 速度慢？
我正在尝试在 Canvas 上使用旋转，我现在有了它，因此每个对象都有自己的旋转。如果没有它们旋转，我可以在一台非常低端的计算机上在屏幕上显示大约 400 个对象，在一台正常库存的计算机上显示近 20

IT老高

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

MongoDB 获取文档速度慢(使用索引)