performance - CouchDB 如何处理定期更新的数据集？-6ren

performance - CouchDB 如何处理定期更新的数据集？

转载作者：行者123 更新时间：2023-12-02 00:40:10

25

4

我计划在项目中使用 CouchDB。但是由于查询机制涉及编写 View (这很像常规 RDMBMS 上的索引)，我想知道，如果文档数据库不断更新(写入繁重的数据库)，与常规 RDBMS 相比，CouchDB 的性能会好吗？或者我们是否必须偶尔压缩/重新索引系统以使其执行得更快？

最佳答案

您可能会这样考虑 CouchDB View 模型的优点/缺点。 (CouchDB 黑客可能不同意，但 IMO 它对用户来说已经足够准确了。)

View 函数在首次创建时总是执行完整的“表扫描”(就像 RDBMS BTW)
只要没有副作用，map 和 reduce 函数可以是任意复杂的
每个文档和 map/reduce 结果都被缓存并且不再计算
如果您添加或更改文档，它(并且只有它)将被重新计算(并缓存)到该 View

鉴于这些，您可以得出一些关于 CouchDB 性能的结论:

整个数据集从来没有重新索引阶段，每次文档更新只是增量
更改 View 函数会强制重建整个索引
由于 CouchDB 和 RDBMS 都必须为新数据更新索引，因此有理由认为对于大量更新/插入使用，性能会相似。

显然 YMMV 和标准的逃避，“你必须测试你自己的负载”适用。但是，我将添加更多注意事项。

我说 RDBMS 在探索式数据查询方面表现出色。当您甚至不知道要从您的数据中提出什么问题时，您真的无法击败结构化查询的语言。
但是，一旦您定义了想要了解的内容，CouchDB(也许还有 Hadoop)会提供最丰富的查询系统，因为您只是在编写代码。
如果您的数据集很大，NoSQL 数据库会更容易扩展。例如，CouchDB-Lounge允许一组沙发进行并行处理。 Hadoop 做同样的事情，所以它会归结为次要考虑因素:熟悉度、可维护性、CouchDB 是一个 Web 服务器，但需要更多的 DIY； Hadoop 以复杂性、外来性等为代价将更多集群管理内部化。

我希望这有助于阐明您的决定!

关于performance - CouchDB 如何处理定期更新的数据集？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2848428/

25

4

0

文章推荐： cruisecontrol - 构建失败后如何停止巡航控制重建？

文章推荐： facebook - Facebook 在添加链接时如何检测图像？

文章推荐： linq-to-sql - 嵌套的 linq-to-sql 查询

文章推荐： wcf - Silverlight 4 是否支持 wshttpbinding？

couchdb - 按用户角色划分的 Couchdb/Couchdb 复制策略
我正在设计一个用于任务管理的移动应用程序(待办事项列表以及许多额外的好东西)，可以离线使用并在重新连接时同步。 Couch 和 Pouch DB 给我留下了深刻的印象，但我仍然不确定数据库和角色的最佳
couchdb - CouchDB 是否支持多范围查询？
CouchDB 中如何实现多范围查询？对于单个范围条件， startkey 和 endkey 组合工作正常，但同样的事情不适用于多范围条件。我的 View 函数是这样的: "function(doc
couchdb - CouchDB 中不同数据库之间的连接
是否可以在不同的 CouchDB 数据库之间进行连接？我知道，我可以将所有数据放入同一个数据库中，但我想使用 Ubuntus DesktopCouch，它有一些默认数据库，比如我想使用的联系人和笔记。
couchdb - CouchDB 中的多键搜索
给定以下对象结构: { key1: "...", key2: "...", data: "..." } 有没有办法通过查询 key1 和 key2 而不设置两个不同的 View (每
couchdb - CouchDB 中的复杂动态查询
我从 CouchDB 开始，需要一点帮助。我有很多数据在表中列出给用户。用户应该能够通过多个动态参数过滤该数据。例如。假设有一个包含日期、作者、标签、is_published、标题字段的表。用户
couchdb - 无法启动 CouchDB
刚刚在 mac 山狮上使用 brew 安装了 CouchDb。一切顺利，直到我遇到以下问题启动服务器我不知道 erlnag 并且无法分析转储文件 `couchdb Apache CouchDB 1.2
couchdb - CouchDB 中的相关对象
在使用关系数据库工作了这么长时间后，我真的很努力地理解这个新概念...... 谁能解释我应该如何进行存储，比如类别层次结构？在关系数据库中，我有: 类别: 类别编号父类别 ID 姓名或那种性质的
couchdb - CouchDB 真的可以用于桌面应用程序吗？
我希望有人可以在这里验证或更正我的结论。我正在考虑写一个小的副项目。我想创建一个用于记笔记的桌面应用程序，该应用程序将同步到 Web 服务器，以便多个安装可以保持同步并共享数据，并且如果需要，还可以
couchdb - CouchDB 附件的自定义属性
我试图在单个 CouchDB 文档中存储多个独立附件，并为每个附件分配任意属性(即描述)。是否有这样做的约定？据我所知，我无法将它们插入 _attachments直接构造。提前致谢! 最佳答案您不能
couchdb - CouchDB 文档版本控制的最佳实践
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 2年前关闭。 Improve t
couchdb - CouchDB 中的过滤和更新功能？
这些功能是什么？我在哪里可以阅读有关它们如何工作的信息？ CouchDB 权威指南没有解释它，很奇怪。最佳答案来自 CouchDB 权威指南: There are other design do
couchdb - CouchDb 中跨数据库的链接文档
我一直在阅读 Linked documents在 CouchDb 文档中，它看起来很好。但是是否可以在数据库 A 中编写一个 View 来从数据库 B 发出文档？我需要它，因为我们在不同的数据库中存
couchdb - CouchDB 中的_deleted_conflicts？
使用 CouchDB 1.0.1。我删除了一些文件，然后我放了一些其他的文件 _id作为删除的。现在这些新文档有 _deleted_conflicts field : "_deleted_conf
couchdb - CouchDB 每用户数据库方法对于拥有大量共享数据的用户是否可行？
我想实现一个 webapp - 一个集成来自各种来源的数据并将它们显示给用户的提要。用户应该只能看到他有权阅读的提要项目(例如，因为它们属于他所属的项目)。但是，许多用户可能(并且将会)看到一个提要项
couchdb - CouchDB 是否支持参照完整性？
我是 CouchDB 的新手并正在学习它。我没有遇到 CouchDB 对参照完整性的支持。我们可以为 CouchDB 文档中的字段创建外键吗？例如是否可以确保供应商数据库中提供订单文档中使用的供应
couchdb - couchdb 中的唯一约束
是否有任何技术/建议来强制执行独特的约束？是的，我们可以创建唯一的 key ，但我们不能更改 key 和 key ，而且这种方法不适合复杂的验证(单独的唯一登录、单独的唯一电子邮件等...) 例如，一
couchdb - CouchDB 文档建模原则
我有一个问题，我已经尝试回答一段时间了，但无法弄清楚: 您如何设计或划分 CouchDB 文档？以博客文章为例。半“关系”方法是创建一些对象: 发帖用户评论标签片段这很有道理。但我正在尝
couchdb - CouchDB 可以处理数千个独立的数据库吗？
CouchDB 可以在同一台机器上处理数千个独立的数据库吗？假设您有一组 BankTransaction。有数千条记录。 (编辑:实际上并不存储事务——只需考虑大量非常小的、频繁更新的记录。它基本上
couchdb - Couchdb 如何存储重复的附件？
我有一个 CouchDB 数据库，主要存储文档附件。文件存储在数据库中，URL 结构如下:/db-name/numeric-file-id/official-human-readable-file-
couchdb - CouchDB 数据库会在短时间内变得非常大吗？
我正在阅读 Apress 的《Beginning CouchDB》一书，其中有一行让我有点困惑: Also important to note is that CouchDB will never o

首页

博学

6Ren·AI

商城

performance - CouchDB 如何处理定期更新的数据集？