- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我的 MMO 人口普查/Angular 色统计跟踪应用程序中,我从用户处获取输入批处理,每个批处理最多包含 5-20k 个文档,我需要将其聚合到数据库中。我需要寻找特定的标准来确定输入中的文档是否已存在于集合中并且需要更新,或者它是否是全新的并且需要插入到集合中。
为了让我的应用程序正常工作,我可以准确地确定在处理输入后实际更新和/或直接添加了多少文档,这一点也非常重要。
为了更好地解释我想要做什么,我将其分解为一个简化的示例,我可以向您展示输入的样子以及所需的结果。
<小时/>作为以下输入案例的起点,集合如下所示:
collection = [
{ name: 'Jean', server: 'Alpha', level: 9 },
{ name: 'Anna', server: 'Beta', level: 17 },
{ name: 'Jean', server: 'Beta', level: 10 }
];
基本上,我需要涵盖 3 个输入案例。
<小时/>案例#1
当我收到具有全新名称
+服务器
组合的输入时,应将新文档添加到集合中
input = { name: 'Victor', server: 'Alpha', level: 22 };
应该变成:
collection = [
{ name: 'Jean', server: 'Alpha', level: 9 },
{ name: 'Anna', server: 'Beta', level: 17 },
{ name: 'Jean', server: 'Beta', level: 10 },
{ name: 'Victor', server: 'Alpha', level: 22 }
];
案例#2
当我收到包含现有name
+server
组合的输入,但具有更高级别
时,应更新现有文档
input = { name: 'Jean', server: 'Alpha', level: 10 };
应该变成
collection = [
{ name: 'Jean', server: 'Alpha', level: 10 },
{ name: 'Anna', server: 'Beta', level: 17 },
{ name: 'Jean', server: 'Beta', level: 10 }
];
案例#3
当我收到包含现有 name
+server
组合的输入,但等于或更低时级别
,什么都不会发生,集合应该保持原样
input = { name: 'Jean', server: 'Alpha', level: 9 };
或
input = { name: 'Jean', server: 'Alpha', level: 8 };
应该保留:
collection = [
{ name: 'Jean', server: 'Alpha', level: 9 },
{ name: 'Anna', server: 'Beta', level: 17 },
{ name: 'Jean', server: 'Beta', level: 10 }
];
<小时/>
到目前为止我所做的基本上是将整个集合提取到一个数组中,然后使用 Array.filter 找出集合中已经存在的输入并使用 更新它们findOneAndUpdate
,以及哪些输入是新的,然后使用 insertMany
将它们插入到集合中:
Test.find({}, async (err, documents) => {
if (err) return console.log(err);
if (documents.length > 0) {
const changedInputs = inputs.filter(byChanged(documents));
const newInputs = inputs.filter(byNew(documents));
const insertResult = await Test.insertMany(newInputs);
const inserted = insertResult.length;
const updateResults = await Promise.all(compileUpdatePromises(changedInputs));
let updated = 0;
updateResults.forEach(updateResult => {
updated = updateResult === 'updated' ? updated + 1 : updated;
});
console.log('updated:', updated);
console.log('inserted:', inserted);
}
});
Link to a gist with the whole example
当集合中没有太多文档时,这工作得很好,但现在它已经增长到 50k+ 文档,它变得非常慢,并在此过程中阻塞 mongo 连接,这也阻塞了所有其他调用的整个 api。
一旦这个应用程序获得更多流量,它就有可能快速增长到包含一百万个文档的集合,然后不断更新。
是否有任何简单且更有效的方法可以让 mongodb 为我完成所有这些艰苦的工作,而不是我自己完成所有工作?
<小时/>更新1:
根据simagix和黑化的建议,我非常接近解决方案。这就是我更改后的代码现在的样子:
const bulkInput = inputs.map(input => ({
updateOne: {
filter: { name: input.name, server: input.server, level: { $lte: input.level } },
upsert: true,
update: { $set: { name: input.name, server: input.server, level: input.level } }
}
}));
Test.bulkWrite(bulkInput).then(result => {
console.log('inserted:', result.nUpserted, 'updated:', result.nModified);
});
现在的问题是案例#3的第二个示例:
input = { name: 'Jean', server: 'Alpha', level: 8 };
结果:
collection = [
{ name: 'Jean', server: 'Alpha', level: 9 },
{ name: 'Anna', server: 'Beta', level: 17 },
{ name: 'Jean', server: 'Beta', level: 10 },
{ name: 'Jean', server: 'Alpha', level: 8 }
];
<小时/>
更新2:
只需制作复合索引
testSchema.index({ name: 1, server: 1 });
到唯一的复合索引
testSchema.index({ name: 1, server: 1 }, { unique: true });
现在我必须找到一个正确的解决方案来处理案例 #3 示例 2 引发的 E11000 重复键错误
异常。
最佳答案
首先,设置复合索引。 https://docs.mongodb.com/manual/core/index-compound/
在 mongodb 和 mongoose 上都可用。
其次,请编写正确的检索查询。 $or ( https://docs.mongodb.com/manual/reference/operator/query/or/ ) 当索引支持时是 O(k log n),其中 k 是匹配项的数量。
或者,尝试批量操作。 https://docs.mongodb.com/manual/reference/method/Bulk/ 。
它可以返回成功查找/更新的数量。 https://docs.mongodb.com/manual/reference/method/BulkWriteResult/ 。添加一个额外的字段来查找级别: { $lt: currlvl } 仅有条件地进行更新。我不太清楚如何将其与更新插入结合起来。
最后,如果我是你,我会散列/连接服务器和名称并将其设为 id。会让生活变得更加轻松。
关于javascript - 使用 mongodb/mongoose 有条件地将 5-20k 文档的输入批处理处理为包含多达一百万个文档的集合的有效方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56824760/
我正在尝试制作一个基于文本的批处理游戏。但是我刚开始写我以前从未遇到过的问题时遇到了一个问题。 :menu :: the game menu - opens when the game starts
我正在构建一个社交媒体应用程序,用户需要发布一些内容,然后将发布的内容传播给他/她的 4 个圈子内的所有成员。这意味着查询进入循环。它就像一个家谱。逻辑工作得很好。但现在,当每个圈子中的成员数量不断增
1. DECLARE TYPE ref_cursor_type IS ref CURSOR; v_mycursor ref_cursor_type;
我想在这里做的是循环直到按下“x”。我知道 CHOICE 带有 /T 选项。 但是 CHOICE 对我要播放的动画的超时时间太长。这是一个例子: @echo off cls set frame=2 :
我已经寻找解决方案,但我仍然遇到问题。我有两个文件: File1.txt 1111 2222 3333 File2.txt 1111 2222 3333 4444 我想要一个只有差异的输
我正在做一个批处理脚本,必须检查计算机上是否安装了一些程序。为此,我执行 programName --version我将输出存储在一个变量中。问题是当我尝试与正则表达式进行比较时(只知道该程序是否存在
我知道如何从同一个批处理文件中的函数返回值,但我发现从不同的批处理文件返回值时存在一些问题。下面是一个例子: 文件 1.cmd SETLOCAL ENABLEEXTENSIONS SETLOCAL E
我相信这个问题的答案应该很简单。我从一个地方获取目录列表并将它们存储到文本文档中。然后我读取文本文档名称并将它们存储到一个数组中。在此过程结束时,我希望删除数组中的所有条目。 我想这样做的原因是因为我
我家有两个摄像头,几乎每天都在创建图像。他们将它们保存到我的FTP服务器(Fritz.Box\Nas驱动器)。 文件夹结构如下: +-2016-08-24 +-+Subfolder +----+Ano
在Windows Batch中执行此操作。我有一个名称列表,并要求用户输入其名称。 我想检查该名称是否已经存在于列表中,如果存在,则直接进入goto,否则它将名称添加到列表中。 @echo off s
我正在编写一个批处理文件,我想运行一个 for 循环,将它的第一个值设置为一个变量。我只需要命令的第一个值,但我找不到另一种方法来做到这一点。我设置它的方式是使用一个 for 循环,然后是一个 do
我需要创建一个批处理文件,使用tracert命令跟踪一些IP,并将跟踪写入txt文件。我希望它很快,所以我想为每个跟踪启动一个新命令,以使所有跟踪请求立即启动。 这是我的 ping.bat: @ech
我想在批处理文件中使用PowerShell命令发送电子邮件。为此,我实现了一个名为 sendMail 的函数。我这样称呼它: setlocal enabledelayedexpansion call:
想要使用 java 执行 selenium 脚本/批处理脚本。根据输入参数调用脚本/批处理脚本。 了解如何使用 java 代码运行脚本/批处理。 请帮帮我。 最佳答案 要运行 java 项目中文件中包
我正在练习 JDBC 批处理并遇到错误: 错误1:不支持的功能错误2:执行不能为空或为null Property files include: itemsdao.updateBookName = Up
我从 json 文件中得到了以下字符串: 39468856, 现在,我想用这些数字进行计算..因此,我必须删除末尾的 , 。 此时我使用以下代码: for /f "skip=24 tokens=2"
我有一堆 SQL 查询作为文件存储在磁盘上。 它们都是纯 SELECT 查询,换句话说,它们只做读操作。 我正在连接到 Oracle 11g 数据库,我想测量所有这些查询的大致执行时间。有没有办法以编
我正在使用 java 来存储属性文件的目录路径。 然后在 bat 文件中我使用属性作为变量。 问题出在 Java 中,文件路径存储为 SOME_VAR=D\:\\Madhan\\Program Fil
我想用“%”替换字符串中的“mod”:set string=%string:mod=x%我应该输入什么作为“x”? 最佳答案 您可以通过启用延迟扩展来做到这一点,以便您可以使用 !作为分隔符。然后,将
在我目前正在处理的批处理文件中,我遇到了一个小问题。我有一个名为 Dimensions(number from 1-5, defined in a for /l loop).txt 的文件,其中包含
我是一名优秀的程序员,十分优秀!