Azure DocumentDB 按 ID 查询非常慢-6ren

Azure DocumentDB 按 ID 查询非常慢

转载作者：行者123 更新时间：2023-12-04 11:33:40

26

4

我有一个 16GB 的集合，有 2 个分区。当我通过 ID 查询文档时，速度非常慢。但是通过索引字段查询速度很快。两者都是跨分区查询，如果我通过查询传递分区键，速度会很快，但分区键并不总是可用于我的查询。在 Azure 门户中使用 .NET SDK 和文档资源管理器查询得到了类似的结果。

该集合具有自定义索引策略，但据我所知，您不需要索引 Id ，否则可能根本不可能。

以下是我的查询及其相应的请求费用。

SELECT * FROM c where c.id = 'unique-id-123'
-- Request Charge: 344940.79 RUs, Document Count: 1

SELECT * FROM c WHERE c.otherId = 'NOT-so-uniqueId-123'
-- Request Charge: 5.08 RUs, Document Count: 3

如您所知，Id 是唯一的，因此查询返回 1 个文档，而第二个查询则通过 otherId 进行过滤，后者不太唯一并返回 3 个文档。另请注意第一个查询的 RU 消耗非常高。

那么为什么第二个查询比通过 Id 查询更快呢？

更新:
以下是针对上述查询收集的指标。

按ID查询:

Read 1 records in 1497 ms, 339173.109 RU, Size: 6873022 KB
QueryPreparationTime(ms): CompileTime = 2, LogicalBuildTime = 0,
     PhysicalPlanBuildTime = 0, OptimizationTime = 0
QueryEngineTime(ms): DocumentLoadTime = 1126, IndexLookupTime = 0,
     RuntimeExecutionTimes = 356, WriteOutputTime = 0

按索引字段查询:

Read 4 records in 2 ms, 7.56 RU, Size: 9 KB
QueryPreparationTime(ms): CompileTime = 0, LogicalBuildTime = 0, 
     PhysicalPlanBuildTime = 0, OptimizationTime = 0
QueryEngineTime(ms): DocumentLoadTime = 0, IndexLookupTime = 1, 
     RuntimeExecutionTimes = 0, WriteOutputTime = 0

这些证明通过 Id 进行的查询正在执行表扫描，因为大部分时间都来自于 DocumentLoadTime，而 IndexLookupTime 没有任何值。
但我认为 Id 应该是主键，并且默认按照此 answer 进行索引作者:@andrew-liu。

最佳答案

Microsoft 支持人员做出了回应，并解决了该问题。他们为该集合添加了 IndexVersion 2。不幸的是，它还不能从门户获得，并且新创建的帐户/集合仍然没有使用新版本。您必须联系 Microsoft 支持人员才能对您的帐户进行更改。

以下是使用索引版本 2 的集合的新结果，并且有巨大的改进。

SELECT * FROM c where c.id = 'uniqueValue'
-- Index Version 1: Request Charge: 344,940.79 RUs
-- Index Version 2: Request Charge: 3.31 RUs

SELECT * FROM c WHERE c.indexedField = 'value' AND c.id = 'uniqueValue'
-- Index Version 1: Request Charge: 150,666.22 RUs 
-- Index Version 2: Request Charge: 5.65 RUs

关于Azure DocumentDB 按 ID 查询非常慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49684890/

26

4

0

文章推荐： r - 按每行中 NA 的数量对数据进行排序

文章推荐： r - 将列名传递给 mutate_each 的函数

aws-documentdb - DocumentDB 3.6版本的预期支持计划
AWS DocumentDB“与 MongoDB 兼容”意味着支持 3.6 和 4.0 版 API。我已经在3.6版本恢复数据并保存为快照。我想知道 AWS 将支持 3.6 版本多长时间。如果万一
azure - 部署 DocumentDb 帐户后无法直接连接到 DocumentDb
我有一个 ARM 模板，用于将 DocumentDB 以及其他 Azure 资源部署到资源组。我希望我的 ARM 模板设置一个使用 DocumentDB 作为输出的流分析作业。为此，ARM 模板创建的
aws-documentdb - 为 Amazon DocumentDB 启用更改流
我知道我们可以使用 Mongo shell 启用(或禁用)Amazon Document DB 的更改流。是否可以从 AWS 控制台或 MongoDB 驱动程序启用更改流？最佳答案您可以使用mod
aws-documentdb-mongoapi - 即使使用 maxTimeMS :0，DocumentDB 长时间运行的查询也会超时
我正在尝试查询包含 500M 文档 (1Tb) 的 documentDB。 var t1 = Date.now(); 'Total X Records:'; db.runCommand({aggreg
aws-documentdb - 与 Java 的 AWS DocumentDB TLS 连接
我在通过 TLS/SSL 使用纯 Java 连接我的 DocumentDB 集群时遇到问题我按照 AWS docs 遵循的程序这是: 我下载了 .pem来自 AWS 的文件并复制到我的 java 项
aws-documentdb-mongoapi - AWS DocumentDB 是否支持 MongoDB 2dshpere 索引？
我正在尝试使用新的 AWS DocumentDB 服务运行现有应用程序。我试图从 mongo shell 运行db.geojson.createIndex( { geoData : "2dsphere
azure - DocumentDB REST API : x-ms-documentdb-partitionkey is invalid
我尝试使用 REST API 从 DocumentDB 获取文档。我正在使用分区集合，因此需要添加“x-ms-documentdb-partitionkey” header 。如果添加此内容，我会收到
azure - 为什么我的主 DocumentDB key 和辅助 DocumentDB key 没有显示在 Azure 门户中？
我刚刚创建了一个新的 DocumentDB 实例。当我转到新 Azure 门户上的“ key ”区域时，我没有看到主键或辅助键。我的 URI 已列出。我尝试使用重新生成功能希望能够创建 key ，但没
azure - DocumentDb 客户端接收无效的 api 版本 documentdb 确保传递有效的 x-ms-version header 值
我正在通过模拟器进行一些本地 DocumentDb 开发。我的 DocumentDb 模拟器已经使用了一两个月了。当我下载 DocumentDb 客户端的最新 Nuget 组件时，我无法连接到它并收到
node.js - AWS-DocumentDB 不支持 $lookup 运算符，AWS-DocumentDB 中 $lookup 的任何替代方案
DocumentDB 不支持“$lookup”运算符，DocumentDB 中 $lookup(MongoDB) 的任何其他替代方案。这是 DocumentDB 支持的运算符列表。 https://
DocumentDB listchangestreams()
按照AWS文档，我们尝试使用以下命令列出所有更改流。我们在MongoDB Compass应用程序中提供的MongoSH中运行它。但我们收到一条错误消息：“ReferenceError：DBComman
Azure DocumentDB - 可以通过自定义索引改进插入请求费用吗？
我正在将具有以下结构的文档插入/更新插入到 DocumentDB 中: 使用默认索引时，更新插入此格式文档的请求费用为 10.67 RU。这似乎比我预期的要高，所以我正在寻求优化。阅读本文中的性能提
azure - documentdb 中的同构与异构
我正在使用 Azure DocumentDB，并且我在 NoSql 中的所有经验都是在 MongoDb 中。我查看了定价模型，成本是按每个系列计算的。在 MongoDb 中，我会为我正在使用的内容创建
azure - DocumentDB 连接字符串
Azure 应用程序设置(适用于 azure 函数)有一个用于 DocumentDB 连接字符串的选项有人知道如何填充/格式化它吗？我目前使用: var documentDbEndpointUri
azure - documentDB 上的事务
我们的数据存储在 documentdb 中。我们确实需要在一笔交易中执行涉及多个文档的操作。有没有办法在 documentDB 上执行类似 sqlserver 的事务？最佳答案如果您执行客户端操作
azure - DocumentDB - 无法比较查询中的两个路径
Microsoft Azure 文档 BadRequestException 使用针对未范围索引的路径的筛选器指定了无效查询。考虑在请求中添加允许扫描 header 。我的查询是: SELECT c
aws-documentdb - mongodb索引什么时候加载到内存中？
我想弄清楚何时将 Mongodb 索引加载到内存中。假设我有 n 个集合，每个集合都有 m 个索引。那么mongodb启动的时候，会不会把所有n x m的索引都加载到内存中呢？根据文档，他们提到如果
azure - DocumentDB 替换不起作用
我最近意识到 DocumentDB 通过 ReplaceDocumentAsync 支持独立更新操作。我已将下面的更新插入操作替换为替换操作。 var result = _client .U
azure - DocumentDB 上的并发
这是 DocumentDB 上的一个新手问题。我们希望在我们的应用程序中使用 DocumentDB。我们有多个用户更改存储在 DocumentDB 中的数据。我们如何确保一个用户不会覆盖另一用户的更改
azure - documentdb 在集合的所有分区中执行存储过程？
是否可以对所有分区集合执行存储过程。如果不是，我怎样才能在不往返的情况下存档？提前致谢。最佳答案不，存储过程在单个分区中执行，并且执行存储过程时没有自动扇出。调用时需要指定分区键。假设您的意思

首页

博学

6Ren·AI

商城

Azure DocumentDB 按 ID 查询非常慢