azure - DocumentDb GUID 索引精度-6ren

azure - DocumentDb GUID 索引精度

转载作者：行者123 更新时间：2023-12-01 08:26:45

27

4

假设我们的文档中有一个非唯一的 GUID/UUID 值:

[
  {
    "id": "123456",
    "Key": "117dfd49-a71d-413b-a9b1-841e88db06e8"
    "Name": "Kaapstad",
  },
  ...
]

我们只想通过平等来查询这一点。不需要范围或 orderby 查询。例如:

SELECT * FROM c where c.Key = "117dfd49-a71d-413b-a9b1-841e88db06e8"

下面是索引定义。它是一个使用 String 数据类型的哈希索引(因为不会执行范围查询)(因为 Javascript 本身不支持 Guid)

collection.IndexingPolicy.IncludedPaths.Add(
    new IncludedPath { 
        Path = "/Key/?", 
        Indexes = new Collection<Index> { 
            new HashIndex(DataType.String) { Precision = -1 }
        }
    });

但是最好的索引精度是多少？

This MSDN page 没有让我清楚什么精度值最适合这样的值:

Index precision configuration is more useful with string ranges. Since strings can be any arbitrary length, the choice of the index precision can impact the performance of string range queries, and impact the amount of index storage space required. String range indexes can be configured with 1-100 or -1 ("maximum"). If you would like to perform Order By queries against string properties, then you must specify a precision of -1 for the corresponding paths.

最佳答案

您可以根据您期望包含属性键(在示例中恰好是 Key 属性)的路径的文档数量来微调索引精度值。

哈希索引的索引精度指示将属性值哈希到的字节数。因此，降低精度值有助于优化存储索引所需的存储量。提高精度值(在哈希索引的上下文中)有助于防止索引上的哈希冲突。

例如，假设路径 foo 上的哈希索引精度值为 3。

3 字节 = 3 * 8 = 24 位。

24 位可以支持:2^24 = 16,777,216 个值

根据鸽巢原理，在使用 foo 属性存储 >16,777,216 个文档时，保证会发生哈希冲突。当发生哈希冲突时，DocumentDB 将需要对找到的文档子集执行扫描。例如，如果您有 30,000,000 个具有 foo 属性的文档 - 您预计平均会扫描 2 个文档。

关于azure - DocumentDb GUID 索引精度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32732858/

27

4

0

文章推荐： jquery - 使用 jQuery 和标题从下拉列表中获取选定的值

文章推荐： jQuery rel 属性

文章推荐： jquery - 使用jquery动态设置递增的链接id？

aws-documentdb - DocumentDB 3.6版本的预期支持计划
AWS DocumentDB“与 MongoDB 兼容”意味着支持 3.6 和 4.0 版 API。我已经在3.6版本恢复数据并保存为快照。我想知道 AWS 将支持 3.6 版本多长时间。如果万一
azure - 部署 DocumentDb 帐户后无法直接连接到 DocumentDb
我有一个 ARM 模板，用于将 DocumentDB 以及其他 Azure 资源部署到资源组。我希望我的 ARM 模板设置一个使用 DocumentDB 作为输出的流分析作业。为此，ARM 模板创建的
aws-documentdb - 为 Amazon DocumentDB 启用更改流
我知道我们可以使用 Mongo shell 启用(或禁用)Amazon Document DB 的更改流。是否可以从 AWS 控制台或 MongoDB 驱动程序启用更改流？最佳答案您可以使用mod
aws-documentdb-mongoapi - 即使使用 maxTimeMS :0，DocumentDB 长时间运行的查询也会超时
我正在尝试查询包含 500M 文档 (1Tb) 的 documentDB。 var t1 = Date.now(); 'Total X Records:'; db.runCommand({aggreg
aws-documentdb - 与 Java 的 AWS DocumentDB TLS 连接
我在通过 TLS/SSL 使用纯 Java 连接我的 DocumentDB 集群时遇到问题我按照 AWS docs 遵循的程序这是: 我下载了 .pem来自 AWS 的文件并复制到我的 java 项
aws-documentdb-mongoapi - AWS DocumentDB 是否支持 MongoDB 2dshpere 索引？
我正在尝试使用新的 AWS DocumentDB 服务运行现有应用程序。我试图从 mongo shell 运行db.geojson.createIndex( { geoData : "2dsphere
azure - DocumentDB REST API : x-ms-documentdb-partitionkey is invalid
我尝试使用 REST API 从 DocumentDB 获取文档。我正在使用分区集合，因此需要添加“x-ms-documentdb-partitionkey” header 。如果添加此内容，我会收到
azure - 为什么我的主 DocumentDB key 和辅助 DocumentDB key 没有显示在 Azure 门户中？
我刚刚创建了一个新的 DocumentDB 实例。当我转到新 Azure 门户上的“ key ”区域时，我没有看到主键或辅助键。我的 URI 已列出。我尝试使用重新生成功能希望能够创建 key ，但没
azure - DocumentDb 客户端接收无效的 api 版本 documentdb 确保传递有效的 x-ms-version header 值
我正在通过模拟器进行一些本地 DocumentDb 开发。我的 DocumentDb 模拟器已经使用了一两个月了。当我下载 DocumentDb 客户端的最新 Nuget 组件时，我无法连接到它并收到
node.js - AWS-DocumentDB 不支持 $lookup 运算符，AWS-DocumentDB 中 $lookup 的任何替代方案
DocumentDB 不支持“$lookup”运算符，DocumentDB 中 $lookup(MongoDB) 的任何其他替代方案。这是 DocumentDB 支持的运算符列表。 https://
DocumentDB listchangestreams()
按照AWS文档，我们尝试使用以下命令列出所有更改流。我们在MongoDB Compass应用程序中提供的MongoSH中运行它。但我们收到一条错误消息：“ReferenceError：DBComman
Azure DocumentDB - 可以通过自定义索引改进插入请求费用吗？
我正在将具有以下结构的文档插入/更新插入到 DocumentDB 中: 使用默认索引时，更新插入此格式文档的请求费用为 10.67 RU。这似乎比我预期的要高，所以我正在寻求优化。阅读本文中的性能提
azure - documentdb 中的同构与异构
我正在使用 Azure DocumentDB，并且我在 NoSql 中的所有经验都是在 MongoDb 中。我查看了定价模型，成本是按每个系列计算的。在 MongoDb 中，我会为我正在使用的内容创建
azure - DocumentDB 连接字符串
Azure 应用程序设置(适用于 azure 函数)有一个用于 DocumentDB 连接字符串的选项有人知道如何填充/格式化它吗？我目前使用: var documentDbEndpointUri
azure - documentDB 上的事务
我们的数据存储在 documentdb 中。我们确实需要在一笔交易中执行涉及多个文档的操作。有没有办法在 documentDB 上执行类似 sqlserver 的事务？最佳答案如果您执行客户端操作
azure - DocumentDB - 无法比较查询中的两个路径
Microsoft Azure 文档 BadRequestException 使用针对未范围索引的路径的筛选器指定了无效查询。考虑在请求中添加允许扫描 header 。我的查询是: SELECT c
aws-documentdb - mongodb索引什么时候加载到内存中？
我想弄清楚何时将 Mongodb 索引加载到内存中。假设我有 n 个集合，每个集合都有 m 个索引。那么mongodb启动的时候，会不会把所有n x m的索引都加载到内存中呢？根据文档，他们提到如果
azure - DocumentDB 替换不起作用
我最近意识到 DocumentDB 通过 ReplaceDocumentAsync 支持独立更新操作。我已将下面的更新插入操作替换为替换操作。 var result = _client .U
azure - DocumentDB 上的并发
这是 DocumentDB 上的一个新手问题。我们希望在我们的应用程序中使用 DocumentDB。我们有多个用户更改存储在 DocumentDB 中的数据。我们如何确保一个用户不会覆盖另一用户的更改
azure - documentdb 在集合的所有分区中执行存储过程？
是否可以对所有分区集合执行存储过程。如果不是，我怎样才能在不往返的情况下存档？提前致谢。最佳答案不，存储过程在单个分区中执行，并且执行存储过程时没有自动扇出。调用时需要指定分区键。假设您的意思

首页

博学

6Ren·AI

商城

azure - DocumentDb GUID 索引精度