performance - 为什么从 CouchDB 读取数据这么慢？ (1.5MB/s左右)-6ren

performance - 为什么从 CouchDB 读取数据这么慢？ (1.5MB/s左右)

转载作者：行者123 更新时间：2023-12-04 00:50:47

24

4

我有一个正在运行的 CouchDB (1.1.1) 服务器，其中包含 400-600KB 大小范围内的大量文档。

如果我从数据库中获取一个完整的文档(不是从 View 中，只是原始文档)，它需要 200-400 毫秒才能完成，这相当于大约 1.5MB/s 的吞吐量。

如果我将相同的数据写入磁盘上的原始文件，它们会在 10-20 毫秒(大约 25-50 MB/秒)内加载。

我希望 CouchDB 有一些开销，但是一个数量级(和一些)对于本质上是阅读的东西来说似乎很疯狂!

谁能解释为什么会这样？

更新 :根据下面的要求，curl的时间:

# time curl http://localhost:5984/[dbname]/[documentname]

real    0m0.684s
user    0m0.004s
sys     0m0.020s

获取的文档为 642842 字节。我已经在标准 1TB 硬盘和 EC2 实例(EBS 卷)上对其进行了测试，结果相似。

最佳答案

我认为这是几个因素

您正在通过 HTTP 获取，这基本上是一种更高延迟的协议(protocol)。特别是，您正在使用 curl 从头开始建立 TCP 连接。 . (Web 浏览器和大多数客户端软件保持一个持久的 HTTP/1.1 keepalive 连接池。)但从根本上说，CouchDB 选择了一种“较慢”的协议(protocol)，因为它是如此通用且如此标准。

对于 CouchDB，您的文档尺寸较大。大多数文档都是一位数或两位数的 KB，而不是三倍数。 CouchDB 在一大口中对 JSON 进行编码/解码(即它不是从磁盘流式传输的。)

EC2(甚至 EBS)i/o 不仅对于数据库来说不太理想(它本身具有高延迟)，而且它还会随着您的邻居生成与您竞争的未知 i/o 突发而波动。

CouchDB 是文件系统之上的文件系统。 .couch 文件看起来很像文件系统本身。所以你正在成倍地降低效率。 .couch 文件和元数据需要对存储进行随机 i/o；和阅读文档需要.couch 中的随机 i/o文件。您可能会看到磁盘延迟的影响成倍增加。您可以比较阅读文档与阅读等效的 MySQL 行，而不是比较阅读文档与阅读文件系统文件。

请注意，我并不是说 CouchDB 实际上很快并且您的结果不正确。恰恰相反:CouchDB 比许多人预期的要慢。一定程度上还有改进和优化的空间；但主要是 CouchDB 认为这些成本对于它带来的更广泛的好处是值得的。

CouchDB 未能通过基准测试，并在严格的测试中脱颖而出。我建议您接下来在 CouchDB 上对完整负载进行基准测试，模拟您对多个并发访问的预期需求，并尽可能接近您对它的实际需求。这将是一个更有帮助的测试，一般来说，CouchDB 在那里的表现令人印象深刻。

也就是说，CouchDB 是一个特定于域的数据库，因此很明显您也在寻找不同的工具。

关于performance - 为什么从 CouchDB 读取数据这么慢？ (1.5MB/s左右)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9807200/

24

4

0

文章推荐： batch-file - 执行批处理文件时任务计划程序中的任务失败

文章推荐： emacs - 如何使 Emacs 中的编译窗口始终为特定大小？

文章推荐： deployment - Windows Server 2016 上的远程调试 UWP 应用

couchdb - 按用户角色划分的 Couchdb/Couchdb 复制策略
我正在设计一个用于任务管理的移动应用程序(待办事项列表以及许多额外的好东西)，可以离线使用并在重新连接时同步。 Couch 和 Pouch DB 给我留下了深刻的印象，但我仍然不确定数据库和角色的最佳
couchdb - CouchDB 是否支持多范围查询？
CouchDB 中如何实现多范围查询？对于单个范围条件， startkey 和 endkey 组合工作正常，但同样的事情不适用于多范围条件。我的 View 函数是这样的: "function(doc
couchdb - CouchDB 中不同数据库之间的连接
是否可以在不同的 CouchDB 数据库之间进行连接？我知道，我可以将所有数据放入同一个数据库中，但我想使用 Ubuntus DesktopCouch，它有一些默认数据库，比如我想使用的联系人和笔记。
couchdb - CouchDB 中的多键搜索
给定以下对象结构: { key1: "...", key2: "...", data: "..." } 有没有办法通过查询 key1 和 key2 而不设置两个不同的 View (每
couchdb - CouchDB 中的复杂动态查询
我从 CouchDB 开始，需要一点帮助。我有很多数据在表中列出给用户。用户应该能够通过多个动态参数过滤该数据。例如。假设有一个包含日期、作者、标签、is_published、标题字段的表。用户
couchdb - 无法启动 CouchDB
刚刚在 mac 山狮上使用 brew 安装了 CouchDb。一切顺利，直到我遇到以下问题启动服务器我不知道 erlnag 并且无法分析转储文件 `couchdb Apache CouchDB 1.2
couchdb - CouchDB 中的相关对象
在使用关系数据库工作了这么长时间后，我真的很努力地理解这个新概念...... 谁能解释我应该如何进行存储，比如类别层次结构？在关系数据库中，我有: 类别: 类别编号父类别 ID 姓名或那种性质的
couchdb - CouchDB 真的可以用于桌面应用程序吗？
我希望有人可以在这里验证或更正我的结论。我正在考虑写一个小的副项目。我想创建一个用于记笔记的桌面应用程序，该应用程序将同步到 Web 服务器，以便多个安装可以保持同步并共享数据，并且如果需要，还可以
couchdb - CouchDB 附件的自定义属性
我试图在单个 CouchDB 文档中存储多个独立附件，并为每个附件分配任意属性(即描述)。是否有这样做的约定？据我所知，我无法将它们插入 _attachments直接构造。提前致谢! 最佳答案您不能
couchdb - CouchDB 文档版本控制的最佳实践
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 2年前关闭。 Improve t
couchdb - CouchDB 中的过滤和更新功能？
这些功能是什么？我在哪里可以阅读有关它们如何工作的信息？ CouchDB 权威指南没有解释它，很奇怪。最佳答案来自 CouchDB 权威指南: There are other design do
couchdb - CouchDb 中跨数据库的链接文档
我一直在阅读 Linked documents在 CouchDb 文档中，它看起来很好。但是是否可以在数据库 A 中编写一个 View 来从数据库 B 发出文档？我需要它，因为我们在不同的数据库中存
couchdb - CouchDB 中的_deleted_conflicts？
使用 CouchDB 1.0.1。我删除了一些文件，然后我放了一些其他的文件 _id作为删除的。现在这些新文档有 _deleted_conflicts field : "_deleted_conf
couchdb - CouchDB 每用户数据库方法对于拥有大量共享数据的用户是否可行？
我想实现一个 webapp - 一个集成来自各种来源的数据并将它们显示给用户的提要。用户应该只能看到他有权阅读的提要项目(例如，因为它们属于他所属的项目)。但是，许多用户可能(并且将会)看到一个提要项
couchdb - CouchDB 是否支持参照完整性？
我是 CouchDB 的新手并正在学习它。我没有遇到 CouchDB 对参照完整性的支持。我们可以为 CouchDB 文档中的字段创建外键吗？例如是否可以确保供应商数据库中提供订单文档中使用的供应
couchdb - couchdb 中的唯一约束
是否有任何技术/建议来强制执行独特的约束？是的，我们可以创建唯一的 key ，但我们不能更改 key 和 key ，而且这种方法不适合复杂的验证(单独的唯一登录、单独的唯一电子邮件等...) 例如，一
couchdb - CouchDB 文档建模原则
我有一个问题，我已经尝试回答一段时间了，但无法弄清楚: 您如何设计或划分 CouchDB 文档？以博客文章为例。半“关系”方法是创建一些对象: 发帖用户评论标签片段这很有道理。但我正在尝
couchdb - CouchDB 可以处理数千个独立的数据库吗？
CouchDB 可以在同一台机器上处理数千个独立的数据库吗？假设您有一组 BankTransaction。有数千条记录。 (编辑:实际上并不存储事务——只需考虑大量非常小的、频繁更新的记录。它基本上
couchdb - Couchdb 如何存储重复的附件？
我有一个 CouchDB 数据库，主要存储文档附件。文件存储在数据库中，URL 结构如下:/db-name/numeric-file-id/official-human-readable-file-
couchdb - CouchDB 数据库会在短时间内变得非常大吗？
我正在阅读 Apress 的《Beginning CouchDB》一书，其中有一行让我有点困惑: Also important to note is that CouchDB will never o

首页

博学

6Ren·AI

商城

performance - 为什么从 CouchDB 读取数据这么慢？ (1.5MB/s左右)