- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
foreach (var doc in await records.Find(filter).ToListAsync())
{
var query = Builders<JobInfoRecord>.Filter.Eq("JobTypeValue", doc.JobTypeValue);
var updatedJobInfo = Regex.Replace(doc.SerializedBackgroundJobInfo, pattern, "<$1></$1>");
var update = Builders<JobInfoRecord>.Update.Set("SerializedBackgroundJobInfo", updatedJobInfo);
records.UpdateOneAsync(query, update).Wait();
}
这是更新文档的最佳方式吗(我将名称中包含 password
的 xml 字符串中的标签值更改为空标签: <adminPassword></adminPassword>
或 demo)?我正在使用 Mongo 驱动程序 2.0.2
我有一个 500 000
的收藏文件,其中我每分钟(希望如此)执行更新大约。 3000
文档。
如何提高 update
的性能操作?
最佳答案
按照您的方式更新时,您需要检索文档内容以便检查它并进行此类修改。 MongoDB 没有以您想要的方式作用于现有值的原子操作,因此当然需要迭代。
在语句的两个版本之间如何匹配正则表达式的“查询”部分没有真正的区别。无论如何,内容在发送到服务器之前都会转换为 BSON,因此如果您使用标准表达式构建器或直接 BSON 文档,影响不大。
但是关于可以进行的性能改进。
如前所述,批量操作是您应该更新此类列表迭代的方式,并且您还“应该”使用游标而不是将所有结果转换为列表,因为它会节省内存。
避开所有特定类型声明并仅表示为 BsonDocument
(这可能会节省您的编码时间,但不是必需的)那么基本示例过程将是:
var pattern = @"(?si)<([^\s<]*workUnit[^\s<]*)>.*?</\1>";
var filter = Builders<JobInfoRecord>.Filter.Regex(x => x.SerializedBackgroundJobInfo,
new BsonRegularExpression(pattern, "i"));
var ops = new List<WriteModel<BsonDocument>>();
var writeOptions = new BulkWriteOptions() { IsOrdered = false };
using ( var cursor = await records.FindAsync<BsonDocument>(filter))
{
while ( await cursor.MoveNextAsync())
{
foreach( var doc in cursor.Current )
{
// Replace inspected value
var updatedJobInfo = Regex.Replace(doc.SerializedBackgroundJobInfo, pattern, "<$1></$1>");
// Add WriteModel to list
ops.Add(
new UpdateOneModel<BsonDocument>(
Builders<BsonDocument>.Filter.Eq("JobTypeValue", doc.JobTypeValue),
Builders<BsonDocument>.Update.Set("SerializedBackgroundJobInfo", updatedJobInfo)
)
);
// Execute once in every 1000 and clear list
if (ops.Count == 1000)
{
BulkWriteResult<BsonDocument> result = await records.BulkWriteAsync(ops,writeOptions);
ops = new List<WriteModel<BsonDocument>>();
}
}
}
// Clear any remaining
if (ops.Count > 0 )
{
BulkWriteResult<BsonDocument> result = await records.BulkWriteAsync(ops,writeOptions);
}
}
因此,您不必为从查询中检索到的每个文档向数据库发出请求,而是创建一个 WriteModel
的 List
代替操作。
一旦这个列表增长到一个合理的值(在本例中为 1000),您就可以在单个请求和所有批处理操作的响应中将写入操作提交给服务器。这里我们使用BulkWriteAsync
.
如果愿意,您可以创建大于 1000 的批处理,但通常这是一个合理的处理数量。唯一真正的硬限制是 16MB 的 BSON 限制,因为所有请求实际上仍然是 BSON 文档,所以这仍然适用。无论如何,接近 16MB 需要很多请求,但是在请求实际到达服务器时如何处理请求时,还需要考虑阻抗匹配,as documented :
"Each group of operations can have at most 1000 operations. If a group exceeds this limit, MongoDB will divide the group into smaller groups of 1000 or less. For example, if the bulk operations list consists of 2000 insert operations, MongoDB creates 2 groups, each with 1000 operations."
因此,通过将请求大小保持在与服务器处理方式相同的水平,您还可以从 yield
中获益,其中“多个批处理”实际上可以并行连接到服务器,而不是让服务器进行拆分和排队。
返回结果为BulkWriteResult
它将包含有关发送的操作批处理中“匹配项”和“修改项”等数量的信息。
自然地,由于操作是“分批”的,因此在循环迭代结束时检查列表中是否还有更多“分批”操作是有意义的,然后当然以相同的方式提交。
还注意到 IsOrdered = false
为 BulkWriteOptions
意味着这批操作实际上并不是按串行顺序执行的,这意味着服务器实际上可以“并行”运行任务。这可以在不需要 promise 顺序的情况下做出“巨大”的速度改进。默认是提交“有序”和串行。
这不是设置此选项所必需的,但是如果您的命令不重要(在这种情况下不应该重要,因为这里没有其他操作请求依赖于文档的先前修改)那么您获得的改进是值得的.
这一切都是为了“减少”对服务器发出的实际请求的数量。发送更新和等待响应需要时间,而且在大型操作中是一项非常昂贵的操作。这就是批量操作要处理的问题,通过在一个请求中应用多个操作。
减少开销是“巨大的”性能提升。这就是您使用它的原因。
关于c# - 如何提高 Mongo 更新操作的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36130102/
我查看了网站上的一些问题,但还没有完全弄清楚我做错了什么。我有一些这样的代码: var mongoose = require('mongoose'), db = mongoose.connect('m
基本上,根据 this bl.ocks,我试图在开始新序列之前让所有 block 都变为 0。我认为我需要的是以下顺序: 更新为0 退出到0 更新随机数 输入新号码 我尝试通过添加以下代码块来遵循上述
我试图通过使用随机数在循环中设置 JSlider 位置来模拟“赛马”的投注结果。我的问题是,当然,我无法在线程执行时更新 GUI,因此我的 JSlider 似乎没有在竞赛,它们从头到尾都在运行。我尝试
该功能非常简单: 变量:$table是正在更新的表$fields 是表中的字段,$values 从帖子生成并放入 $values 数组中而$where是表的索引字段的id值$indxfldnm 是索引
让我们想象一个环境:有一个数据库客户端和一个数据库服务器。数据库客户端可以是 Java 程序或其他程序等;数据库服务器可以是mysql、oracle等。 需求是在数据库服务器上的一个表中插入大量记录。
在我当前的应用程序中,我正在制作一个菜单结构,它可以递归地创建自己的子菜单。然而,由于这个原因,我发现很难也允许某种重新排序方法。大多数应用程序可能只是通过“排序”列进行排序,但是在这种情况下,尽管这
Provisioning Profile 有 key , key 链依赖于它。我想知道 key 什么时候会改变。 Key will change after renew Provisioning Pr
截至目前,我在\server\publications.js 中有我的 MongoDB“选择”,例如: Meteor.publish("jobLocations", function () { r
我读到 UI 应该始终在主线程上更新。但是,当谈到实现这些更新的首选方法时,我有点困惑。 我有各种函数可以执行一些条件检查,然后使用结果来确定如何更新 UI。我的问题是整个函数应该在主线程上运行吗?应
我在代理后面,我无法构建 Docker 镜像。 我试过 FROM ubuntu , FROM centos和 FROM alpine ,但是 apt-get update/yum update/apk
我构建了一个 Java 应用程序,它向外部授权客户端公开网络服务。 Web 服务使用带有证书身份验证的 WS-security。基本上我们充当自定义证书颁发机构 - 我们在我们的服务器上维护一个 ja
因此,我有时会在上传新版本时使用 app_offline.htm 使应用程序离线。 但是,当我上传较大的 dll 时,我收到黄色错误屏幕,指出无法加载 dll。 这似乎与我对 app_offline.
我刚刚下载了 VS Apache Cordova Tools Update 5,但遇到了 Node 和 NPM 的问题。我使用默认的空白 cordova 项目进行测试。 版本 如果我在 VS 项目中对
所以我有一个使用传单库实例化的 map 对象。 map 实例在单独的模板中创建并以这种方式路由:- var app = angular.module('myApp', ['ui', 'ngResour
我使用较早的 Java 6 u 3 获得的帧速率是新版本的两倍。很奇怪。谁能解释一下? 在 Core 2 Duo 1.83ghz 上,集成视频(仅使用一个内核)- 1500(较旧的 java)与 70
我正在使用 angular 1.2 ng-repeat 创建的 div 也包含 ng-click 点击时 ng-click 更新 $scope $scope 中的变化反射(reflect)在使用 $a
这些方法有什么区别 public final void moveCamera(CameraUpdate更新)和public final void animateCamera (CameraUpdate
我尝试了另一篇文章中某人评论中关于如何将树更改为列表的建议。但是,我在某处(或某物)有未声明的变量,所以我列表中的值是 [_G667, _G673, _G679],而不是 [5, 2, 6],这是正确
实现以下场景的最佳方法是什么? 我需要从java应用程序调用/查询包含数百万条记录的数据库表。然后,对于表中的每条记录,我的应用程序应该调用第三方 API 并获取状态字段作为响应。然后我的应用程序应该
只是在编写一些与 java 图形相关的代码,这是我今天的讲座中的非常简单的示例。不管怎样,互联网似乎说更新不会被系统触发器调用,例如调整框架大小等。在这个例子中,更新是由这样的触发器调用的(因此当我只
我是一名优秀的程序员,十分优秀!