performance - 如何提高 MongoDB 中 update() 和 save() 的性能？-6ren

performance - 如何提高 MongoDB 中 update() 和 save() 的性能？

转载作者：搜寻专家更新时间：2023-10-31 22:18:04

24

4

我正在寻找有关如何在以下情况下提高数据库性能的提示。

作为示例应用程序，我今天编写了一个相当简单的应用程序，它使用 Twitter 流 API 来搜索某些关键字，然后我将结果存储在 MongoDB 中。该应用程序是用 Node.js 编写的。

我正在存储 2 个集合。一个存储关键字和一组推文 ID，这些推文 ID 引用找到的提到该关键字的每条推文。使用带有 {upsert:true} 的 .update() 将这些添加到数据库中，以便将新 ID 附加到“ids”数组。

此集合中的示例文档如下所示:

{ “_id”:ObjectId(“4e00645ef58a7ad3fc9fd9f9”)， “ids”:[“id1”，“id2”，“id3”]， “关键词”:“#巧克力”

更新代码:

 keywords.update({keyword: key_word},{$push:{ids: id}},{upsert:true}, function(err){})

第二个集合看起来像这样，只需使用 .save() 即可添加

 {
     "twt_id": "id1",
     "tweet": { //big chunk of json that doesn't need to be shown }
 }

我现在已经在我的 Macbook 上运行了这个程序，它已经运行了大约 2 个小时。我正在存储大量数据，每分钟可能有数百个文档。目前 Mongodb 中的对象数量为 120k+。

我注意到，自从我开始最新的测试运行以来，数据库进程的 CPU 使用率高达 84%，并且一直在逐渐上升。

我正在阅读有关设置索引的内容，但由于我正在添加文档而不是针对它们运行查询，所以我不确定索引是否有帮助。我想到的一个方面是 update() 可能正在执行查找，因为我正在使用 $push 并且索引可能有助于查找。

我应该注意什么以防止 MongoDB 消耗越来越多的 CPU？

最佳答案

您很可能遇到了 MongoDB 中一个非常常见的瓶颈。由于您通过添加字符串非常频繁地更新文档，因此您很可能会用完该文档的空间并迫使数据库通过在尾端重写该文档来不断将该文档移动到内存\磁盘中的不同空间数据文件。

添加索引只会损害写入性能，因此除非您的读取量很大，否则无助于提高性能。

我会考虑更改您的应用程序逻辑来执行此操作:

关键字字段索引
每次检测到推文时，在向数据库中插入任何内容之前，先查询包含该关键字的文档。如果它不存在，则插入一个新文档，但通过在数组中添加一大堆假字符串来填充 ids 属性。然后在插入它之后立即从该数组中删除所有 id。这将导致 mongodb 为整个文档分配额外的空间，这样当您开始向 ids 字段添加 id 时，它将有足够的增长空间。
将推文的 ID 插入到 ids 字段中

关于performance - 如何提高 MongoDB 中 update() 和 save() 的性能？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6423988/

24

4

0

文章推荐： javascript - 如何从下到上为元素的最大高度设置动画？

文章推荐： javascript - HTML 文本框输入模式 0000000-0000

文章推荐： node.js - 如何使用 vows.js 运行清理？

npm-update - 命令 "npm update"与包 "npm-check-updates"
命令 npm update 有什么区别和包裹npm-check-updates ?使用后者是否完全安全？执行后好像是npm update并非所有软件包都已更新，因此似乎不完整。许多其他 popula
node.js - ExpressJS : Sequelize method update need to show updated data as result not num of row updated
我有使用 ExpressJS 和 ORM Sequelize 的 API。我正在尝试使用 Sequelize 中的 update() 方法进行更新。默认情况下，it 方法将返回更新的行数。但我希望结果
ruby-on-rails - "rvm rubygems current"对比 "rvm update --system"对比 "gem update rubygems-update"
关于如何更新 rubygems 有点困惑。过程不断变化(或者至少我从互联网上得到了相互矛盾的信息)。 $ gem outdated rubygems-update (1.8.10 < 1.8.11
javascript - build 目录中的 .hot-update.json、.hot-update.js 和 .hot-update.js.map 文件是什么？
我正在使用 webpack-dev-server处于开发模式( watch )。每次服务器重新加载时，一些 json 和 js 文件都会挤满我的构建目录，如下所示:'hash'.hot-update.
updates - 错误 : Update could not be validated. 确保网络安全并重试。
Mamp Pro 的当前版本是 5.04 (15996)。可用更新窗口显示“Mamp 5.0.0 > 5.1。更新失败，并显示一条消息:错误:无法验证更新。请确保您使用的是安全网络，然后重试。” 更新
MySQL AFTER UPDATE 在特定列中 UPDATE 同一行中的时间戳
我想在浏览量增加时更新时间戳“lastpageview_at”。我想我已经接近了，但我总是遇到语法错误，有人知道为什么或有其他解决方案吗？我的触发器: CREATE TRIGGER Update_l
MySql: SELECT ... FOR UPDATE break before the UPDATE
我正在执行 SELECT ... FOR UPDATE 以锁定一条记录，然后进行一些计算，然后进行实际的 UPDATE。我正在处理 InnoDB 数据库。但是计算可能会以我不想执行 UPDATE 的
sql - 当我在 AFTER UPDATE 触发器中使用 UPDATE 语句时会发生什么？
我需要在表更新时进行一些更新和插入以强制执行正确的数据。将 UPDATE 语句放入触发器中会导致某种“循环”吗？谢谢! 最佳答案更新触发器中的目标表将使触发器再次触发。您可以使用 TRIGGER
JSF + PrimeFaces : `update` attribute does not update component
这是我的布局当我点击链接更新时，该链接应该打开和关闭renderComment bool
AngularJS性能: How to update only the scopes I know need to be updated?
我有一个包含两件事的 Angular 范围: 一个包含 10k 行的巨型表格，需要一秒钟才能渲染一些小的额外信息位于固定的覆盖标题栏中根据您向下滚动页面/表格的距离，我必须更新标题中的小信息位之一
MySQL:我可以在 BEFORE UPDATE 触发器中停止 UPDATE 查询吗？
标题几乎已经说明了一切。 IF NEW.variance <> 0 THEN (kill update) END IF 这可能吗？最佳答案查看手册 (http://dev.mysql.com/do
MySQL 触发器 : turn UPDATE into UPDATE and INSERT?
我有几个表，我想强制执行版本控制，并且有一个生效日期和生效日期。每当应用程序或用户向该表写入更新时，我希望它重定向到两个全新的命令:更新目标记录，以便 EFFECTIVE_TO 日期填充当前日期和时间
mysql - UPDATE row ON UPDATE 触发器，多表条件
我正在使用 Shopware，一件奇怪的事情让我抓狂 :( 所以我将首先解释问题是什么。除了普通商品外，还有多种款式的商品，例如不同尺码的衬衫。这是 XS、S、M、L 和/或不同颜色的同一商品……但
Mysql 在 before update 触发器中发出 update 命令
寻求帮助制作 mysql 触发器。我当前的代码无法按预期工作。我想做的是，如果表A中的字段A被修改，则将字段A复制到表A中的字段B。当前代码如下所示: BEGIN IF new.set_id=301
sql - UPDATE 的 FROM 端如何与 UPDATE 的目标表相关？
以下查询(来自此处Postgres SQL SELECT and UPDATE behaving differently) update fromemailaddress set call =
javascript - d3 : update dataset not updating the DOM
我想使用 D3 使用以下数据创建一个列表: var dataSet = [ { label: 'a', value: 10}, { label: 'b', value: 20},
MySQL:Select then Update 和 UPDATE 哪个更好？
哪个更好，先进行选择，然后进行更新。或者更确切地说，像这样合而为一: UPDATE items set status = 'NEW' where itemid in (1,2,3,
php - Laravel 事件 : updating vs updated?
对于 eloquent model events，updating 和 updated 之间有什么区别？？我的猜测是 updating 在模型更新之前触发，而 updated 在模型更新之后触发。
Angular 2 : *ngFor does not update when array is updated
我有一个对象数组(我们称之为arr)。在我的组件输入之一的 (change) 方法中，我修改了这些对象的属性之一，但在 View (*ngFor) 中没有任何变化。我读到 Angular2 变化检测不
javascript - D3js : data update is not updating right objects
我正在尝试使用 d3.js 构建水平日历时间线。主要目标是突出显示用户的假期和假期。 http://jsbin.com/ceperavu/2/edit?css,js,output 我首先从“开始”日期

首页

博学

6Ren·AI

商城

performance - 如何提高 MongoDB 中 update() 和 save() 的性能？