azure - 如何加速 Cosmos DB 聚合查询？-6ren

azure - 如何加速 Cosmos DB 聚合查询？

转载作者：行者123 更新时间：2023-12-04 15:50:00

26

4

我们的 cosmos db 聚合查询看起来很慢并且消耗大量 RU。以下是详细信息(请参见下面的屏幕截图): 2.4 秒和 3222RU 来计算 414k 记录的结果集。这也仅算一项。通常我们希望一次对多个字段进行求和(只能在单个分区内进行)，但这样做的性能要差得多。

该集合中有 200 万条记录。我们正在使用带 SQL API 的 Cosmos DB。该特定集合按国家/地区代码分区，其中有 414,732 条记录位于法国(“FR”)，其余记录位于美国。文档大小平均为 917 字节，最小为 800 字节，最大为 1300 字节。

请注意，我们还尝试了更稀疏的分区键，例如 device_id(其中有 200 万个，每个设备 1 个文档)，这对于该查询来说结果更差。 c.calcuated.flag1 字段仅代表我们想要保留计数的“状态”(实际上我们有 8 个状态我想总结一下)。

此集合上的索引是默认的，它使用“一致”索引模式，并对所有字段进行索引(包括数字和字符串的范围索引)。RU 设置为 20,000，数据库上没有其他事件。

所以让我知道你对此的想法。是否可以合理地使用 Cosmos DB 来获得一些字段的总和或计数，而不会增加我们的 RU 费用并花费很长时间？虽然 2.4 秒还不错，但我们确实需要亚秒级的查询来完成这种事情。我们的应用程序(基于物联网)通常需要单独的文档，但有时也需要对一个国家/地区的所有文档进行此类计数。

有没有办法提高性能？

最佳答案

Cosmos DB 团队现已对聚合性能和索引的使用方式进行了一些重大更改。这是他们的索引“v2”策略，最近才推出(可能尚未对所有帐户可用，如果您有需要升级的旧数据库，请联系 MSFT)。

您可以将新结果与我最初发布的图片进行比较。

您现在会注意到文档加载时间显示为 0 毫秒，并且检索到的文档大小为 0 字节。我可以确认的加载时间现在确实非常快，因此从服务器端测量时可能会低于 1 毫秒。文档大小为 0 更有意义，因为不需要为此检索文档(仅根据索引进行计数)。

最后你可以看到 RU 从 3222 下降到 7.4 !!!!差异相当大。

现在，在单个分区内对多个列进行求和现在也非常高效，我们可以使用约 50 个 RU 对 200 万个文档一次进行大约 8 次求和，并且从函数 API 端点测量时需要大约 20-70 毫秒(因此包括网络时间)。

Cosmos DB 团队仍需要做更多工作来实现跨分区多列聚合，但我们现在的改进非常有希望。

关于azure - 如何加速 Cosmos DB 聚合查询？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55930571/

26

4

0

文章推荐： Qt如何在使用QScroller时停止拖动QListView的视口(viewport)

文章推荐： SQL - 从数据库中选择最多 'active' 时间

文章推荐： cmd - 嵌套 doskey 宏

python - 我应该将产品图像存储为 db.ListProperty(db.Blob) 还是 db.ListProperty(db.Key)？
我当前正在存储给定产品的上传图像，如下所示: class Product(db.Model): images= db.ListProperty(db.Blob) # More prop
ruby-on-rails - 更快地编写此 rake 命令的方法 - rake db :drop db:create db:migrate db:seed
每次对架构或新迁移文件进行更改时，我都会运行以下命令: rake db:drop db:create db:migrate db:seed 是否有预先构建的等效方法来执行此操作？我从我读到的内容中想
Android Room 数据库文件为空 - .db、.db-shm、.db-wal
在 android 中使用房间作为数据库。当我试图在 sqlviewer 中查看数据时，在数据库文件中找不到表Myapp.db 文件为空。数据/data/packageName/databases/M
ruby-on-rails - 在每个场景之前在 cucumber 中运行 exec 'rake db:drop db:create db:migrate db:seed'
我搜索并尝试了很多次，但没有找到我的答案。我有一些用小 cucumber (在 Rails 项目中)编写的项目的功能文件。所有步骤都已定义，如果我单独启动它们，功能本身运行得很好。我可以将所有场景与我
ruby-on-rails - db :test:clone, db :test:clone_structure, db :test:load, 和 db :test:prepare? 有什么区别
您必须承认，对于 Rails 和数据库的新手来说，rubyonrails.org 上的官方解释使所有这四个任务听起来完全一样。引用: rake db:test:clone Recreate the
ruby-on-rails - 在Heroku Cedar堆栈上运行rake db:drop db:create db:migrate
当我尝试运行时: heroku run rake db:drop db:create db:migrate 我得到错误: Running rake db:drop attached to termin
ruby-on-rails - rake db :migrate db:reset and db:schema:load之间的区别
rake db:migrate 和 rake db:reset 之间的区别对我来说非常清楚。我不明白的是 rake db:schema:load 与前两者有何不同。只是为了确保我在同一页面上: ra
azure - 从 Azure 函数将对象列表保存到 cosmos DB(文档 DB 或 mongo DB)
我们都知道，我们可以使用 Azure 函数(使用 out 参数或使用 return)在 cosmos DB 中一次保存一个文档，例如: object outputDocument = new { i
php - mysql-db 请求 : how to get the db-name and the db-type as output of the request
我有一个包含 60 多个表的 mysql 数据库。这是在我将 joomla 版本 2.5.3 从本地灯移植到网络服务器时构建的。我运行 mysql-db: 移植后我发现我无法登录 amdin 区域。
c# - 如何使用 EF DB First 将 SQL DB 迁移到 Azure SQL DB
我想轻松地将现有数据库迁移到 Azure 托管。在我的项目中，我使用 Entity Framework DB First。有什么经验教训或例子可以说明如何做到这一点吗？最佳答案您本地使用什么数据库
ios - 核心数据 WAL 模式不会持久化对 .db 的更改，只有 .db-wal 和 .db-shm
所以，我一直在使用 MagicalRecord 开发 iPad 应用程序，最近在转移到自动迁移商店后我遇到了一些问题。我需要将我的 .db 文件从一个设备同步到另一个设备，所以我需要所有数据都在 .d
ruby-on-rails - database.yml 文件配置和 postgres - rake db :drop db:create db:migrate
自从我在 Heroku 上部署并希望与生产相匹配后，我最近切换到 postgres 来开发一个 Rails 应用程序。当我将数据库名称设置为“postgres”时，我的应用程序安装了 Postgres
sql-server - 使用 Microsoft OLE DB 提供程序和 SQL Native OLE DB 提供程序建立 DB 连接
我使用 oledb 提供程序(SQLOLEDB 和 SQL Native OLEDB 提供程序)创建了一个示例应用程序。案例 1:提供者 = SQLOLEDB hr = ::CoInitialize
node.js - db.collection.insert 与 db.collection.insertOne 和 db.collection.insertMany 的性能影响
我正在为 NodeJs 使用 mongodb 驱动程序，其中有 3 个方法: 1) db.collection.insert 2) 数据库.collection.insertOne 3) db.col
clojure - db.part/db 的所有字段是什么意思？
我是 datomic 的新手，我仍在努力弄清楚系统是如何构建的。特别是，我不明白 :db.part/db 扮演什么角色，因为每次安装架构时似乎都需要它。有人可以解释一下这一切意味着什么吗？ (需要 '
berkeley-db - Berkeley DB 中的空间索引
Berkeley DB 是否有空间索引，例如 R-tree？最佳答案有人问the same question on the Oracle forum .还没有甲骨文回答。但答案是否定的，它没有任何
php - $db = new DB() 混淆
请解释一下这是什么意思 $db = new DB(DB_DRIVER, DB_HOSTNAME, DB_USERNAME, DB_PASSWORD, DB_DATABASE); 它给了我一个错误 "E
berkeley-db - berkeley-db-je 的最新版本是什么？
berkeley-db-je 的最新版本是什么？来自 oracle , 为 7.5。但来自maven存储库，它是 18.3.12。有没有人知道更多的细节？最佳答案 Berkeley DB Ja
codeigniter - $this->db->replace() 的区别 $this->db->update()
我不明白查询构建器的替换和更新之间的区别。尤其是替换文档... This method executes a REPLACE statement, which is basically the SQL
berkeley-db - Berkeley DB 是开源的吗？我在哪里可以找到它的源代码？
看起来 BerkeleyDB 被 Oracle 收购了，它没有在其网站上发布源代码？最佳答案 Sleepycat 于 2006 年被 Oracle 收购。该产品继续在原始开源许可下可用，并继续得到增

首页

博学

6Ren·AI

商城

azure - 如何加速 Cosmos DB 聚合查询？