- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在寻找有关如何在以下情况下提高数据库性能的提示。
作为示例应用程序,我今天编写了一个相当简单的应用程序,它使用 Twitter 流 API 来搜索某些关键字,然后我将结果存储在 MongoDB 中。该应用程序是用 Node.js 编写的。
我正在存储 2 个集合。一个存储关键字和一组推文 ID,这些推文 ID 引用找到的提到该关键字的每条推文。使用带有 {upsert:true} 的 .update() 将这些添加到数据库中,以便将新 ID 附加到“ids”数组。
此集合中的示例文档如下所示:
{ “_id”:ObjectId(“4e00645ef58a7ad3fc9fd9f9”), “ids”:[“id1”,“id2”,“id3”], “关键词”:“#巧克力”
更新代码:
keywords.update({keyword: key_word},{$push:{ids: id}},{upsert:true}, function(err){})
第二个集合看起来像这样,只需使用 .save() 即可添加
{
"twt_id": "id1",
"tweet": { //big chunk of json that doesn't need to be shown }
}
我现在已经在我的 Macbook 上运行了这个程序,它已经运行了大约 2 个小时。我正在存储大量数据,每分钟可能有数百个文档。目前 Mongodb 中的对象数量为 120k+。
我注意到,自从我开始最新的测试运行以来,数据库进程的 CPU 使用率高达 84%,并且一直在逐渐上升。
我正在阅读有关设置索引的内容,但由于我正在添加文档而不是针对它们运行查询,所以我不确定索引是否有帮助。我想到的一个方面是 update() 可能正在执行查找,因为我正在使用 $push 并且索引可能有助于查找。
我应该注意什么以防止 MongoDB 消耗越来越多的 CPU?
最佳答案
您很可能遇到了 MongoDB 中一个非常常见的瓶颈。由于您通过添加字符串非常频繁地更新文档,因此您很可能会用完该文档的空间并迫使数据库通过在尾端重写该文档来不断将该文档移动到内存\磁盘中的不同空间数据文件。
添加索引只会损害写入性能,因此除非您的读取量很大,否则无助于提高性能。
我会考虑更改您的应用程序逻辑来执行此操作:
ids
属性。然后在插入它之后立即从该数组中删除所有 id。这将导致 mongodb 为整个文档分配额外的空间,这样当您开始向 ids 字段添加 id 时,它将有足够的增长空间。ids
字段中关于performance - 如何提高 MongoDB 中 update() 和 save() 的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6423988/
我正在比较工作簿中的工作表。该工作簿有两张名为 PRE 和 POST 的工作表,每张工作表都有相同的 19 列。行数每天都不同,但特定一天的两张表的行数相同。该宏将 PRE 工作表中的每一行与 POS
我有一个对象数组,我一次循环遍历该数组一个对象,然后进行几次检查以查看该数组中的每个对象是否满足特定条件,如果该对象满足此条件,则复制一个属性将此对象放入数组中(该属性还包含另一个对象)。 for(v
我正在编写一个必须非常快的应用程序。我使用 Qt 5.5 和 Qt Creator,Qt 的 64 位 MSVC2013 编译版本。 我使用非常困倦的 CS 来分析我的应用程序,我看到占用最多独占时间
我有以下 CountDownTimer 在我的 Android 应用程序中不断运行。 CountDownTimer timer_status; timer_status = new CountDown
有一个优化问题,我必须调用随机森林回归器的预测函数数千次。 from sklearn.ensemble import RandomForestRegressor rfr = RandomForestR
我正在努力提高现有 Asp.Net Web 应用程序的数据访问层的性能。场景是。 它是一个基于 Web 的 Asp.Net 应用程序。 数据访问层使用 NHibernate 1.2 构建并作为 WCF
我在我的 Intel Edison 上运行 Debian,并尝试使用 ffmpeg 通过 USB 网络摄像头捕获视频。我正在使用的命令是: ffmpeg -f video4linux2 -i /dev
我有一个 For循环遍历整数 1 到 9 并简单地找到与该整数对应的最底部的条目(即 1,1,1,2,3,4,5 将找到第三个“1”条目)并插入一个空白行。我将数字与仅对应于此代码的应用程序的字符串“
我有一个带有非规范化架构(1 个表)的 postgresql 数据库,其中包含大约 400 万个条目。现在我有这个查询: SELECT count(*) AS Total, (SELECT c
在 Ltac 中实现复杂的策略时,有一些 Ltac 命令或策略调用我预计会失败以及预期失败(例如终止 repeat 或导致回溯)。这些故障通常在故障级别 0 时引发。 更高级别引发的故障“逃避”周
我正在尝试提高 ansible playbook 的性能。我有一个测试剧本如下: --- - name: Test hosts: localhost connection: local g
我正在使用 axios从 Azure 存储 Blob 下载文件 (~100MB)。 axios({ method: 'get', url: uri, onDownloadProgress:
我有一个 ClojureScript 程序,主要对集合执行数学计算。它是在惯用的、独立于主机的 Clojure 中开发的,因此很容易对其进行基准测试。令我惊讶的是(与答案对 Which is fast
我有一个程序必须在硬件允许的情况下尽快发出数千个 http 请求。在现实世界中,这些连接中的每一个都将连接到一个离散的服务器,但我已经编写了一个测试程序来帮助我模拟负载(希望如此)。 我的程序使用 A
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在计算 Clojure 中 3d 点云的边界框。点云表示为 Java 原始浮点数组,点云中的每个点都使用 4 个浮点存储,其中最后一个浮点未使用。像这样: [x0 y0 z0 u0 x1 y1
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在尝试使用rayshader 包制作图像。我很高兴能够使用如下代码创建一个 png 文件: library(ggplot2) library(rayshader) example_plot <-
更新 显然,jQuery 模板可以被编译,并且它有助于显示带有 if 语句 的模板的性能 here . 但是如图here ,预编译的 jQuery 模板对我的情况没有多大作用,因为我的模板不包含逻辑
我是编程新手。我有一个启用分页的 ScrollView ,其中包含许多页面(最多十个),并且在每个页面上都有一个自定义按钮。每个自定义按钮都有一个自定义图像。我在 Interface Builder
我是一名优秀的程序员,十分优秀!