ravendb - 为什么 RavenDB 在索引过程中读取所有文档，而不仅仅是索引使用的集合？-6ren

ravendb - 为什么 RavenDB 在索引过程中读取所有文档，而不仅仅是索引使用的集合？

转载作者：行者123 更新时间：2023-12-04 20:11:48

25

4

我有一个相当大的数据库，里面有大约 260 万个文档，其中我有两个集合，每个集合 120 万个，其余是小集合(<1000 个文档)。当我为小集合创建新索引时，需要花费大量时间来完成索引(因此临时索引是无用的)。似乎 RavenDB 索引过程读取 DB 中的每个文档并检查是否应该将其添加到索引中。我认为只索引索引使用的集合会更好。

此外，当使用 Smuggler 导出数据并且我只想导出一个小集合时，它会读取所有文档并且导出可能需要相当长的时间。同时使用 RavenDB Linq API 和索引的自定义应用程序可以在几秒钟内导出数据。

为什么 RavenDB 会这样？也许有一些配置设置可能会改变这种行为？

最佳答案

RavenDB 实际上没有任何真正的“集合”概念。所有的文件都差不多。它只是查看 Raven-Entity-Name每个文档中的元数据，以确定如何将事物组合在一起，以便按类型查询并在管理工作室中显示“集合”页面。

我不确定这样做的具体理由。我认为这与文档存储使用的底层 ESENT 表有关。或许 Ayende 可以更好地回答。您的特定用例很好地说明了为什么它可能会以不同的方式完成。

您可以尝试的一件事是使用多个数据库。您可以将大量文档放在一个数据库中，而将其他所有文档放在另一个数据库中。当然，你可能会遇到索引相关文档、multi-map/reduce 或其他需要将不同类型的文档放在同一个数据库上的场景的问题。

关于ravendb - 为什么 RavenDB 在索引过程中读取所有文档，而不仅仅是索引使用的集合？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16435881/

25

4

0

文章推荐： visual-c++ - WinRT 应用程序在发布版本中崩溃但未调试

文章推荐： sbt - TERM=Apple_Terminal 在 macOS Sierra 10.12.3 上的奇怪问题

文章推荐： intellij-idea - Intellij/AppCode 增加选定的数值

文章推荐： php - 在 PHP 中，将返回与计算分开有优势吗？

ravendb - RavenDB-检索文档的一部分
我正在玩Raven DB几天，我想将其用作Web聊天应用程序的存储。我有包含一些用户数据和聊天记录的文档-这是大集合的聊天消息。每次加载用户文档时，聊天记录也会加载，即使我只需要几个字段，例如：用户
ravendb - RavenDB:如何使用多个搜索词进行查询
我的实体是: class Resource { string Name; string EmployeeId; } 如何查询多名员工的资源？我尝试了这个: Resource[] Fin
ravendb - RavenDB 的引用完整性
我知道这篇文章的标题会让一些人感到畏缩。我自 2011 年 12 月以来一直在使用 RavenDB，并且逐渐意识到我以不适合使用文档数据库的方式对数据进行建模。首先，我完全明白这一点。其次，考虑到我目
ravendb - RavenDB 动态查询中的谓词无法正常工作
考虑 2 个查询: var test1 = store.OpenSession().Query().Where(x => x.Id == 1).ToList(); var test2 =
ravendb - 用代码创建新数据库，RavenDB
我正在运行 RavenDB.Client 2.0.2173-Unstable。我正在创建一个 Multi-Tenancy 系统，作为我注册过程的一部分，我想创建一个新的 Raven 数据库。我有三行
ravendb - 将 RavenDB 作为 EmbeddableDocumentStore 运行并访问 RavenDB Management Studio
我正在使用在 Visual Studio 2010 中通过 NuGet 安装的嵌入式 RavenDB => RavenDB-Embedded.1.0.499 包。它正在我阅读完这篇优秀文章后开始的当前
ravendb - 集群服务器上不同格式的 RavenDB ID
我们在 AWS 上有一个带有集群 RavenDB 服务器 (5.23) 的 DotNet Core API (C#)。创建文档时，Id 具有不同的格式，具体取决于客户端。如果使用 Swagger/Po
ravendb - 如何使用 RavenDb 完成此查询？
我想知道取回搜索记录总数的最佳方法是什么，同时取回第 N 个 128 记录块数据段，这似乎是 RavenDb 运行时强加的上限。例如给定这个查询，我还需要知道记录的总数。 var bookmarks
ravendb - 使用 RavenDB 进行调试非常慢
我使用的是 RavenDB 2.0.3.0 版。连接调试器后，涉及 RavenDB 的所有内容都运行得非常缓慢。每个查询需要几秒钟才能完成。如果我在调试器坐在那里时按下暂停键，我总是看到它挂断了以下
ravendb - 从 ravendb 删除时数据文件大小不缩小
我使用以下代码从 RavenDB 中删除文档。在 Raven UI 的底部，我可以看到文档数量从 3,000,000 减少到 2,000,000。但是“数据”文件的大小不会缩小。它总是大约100G。
ravendb - 关于在 RavenDB 中轮询新文档的建议
我想在我的 Raven DB 中轮询新文档。推荐的方法是什么？我可以使用 IndexTimestamp 还是可以依赖文档的顺序？我想我想分两步完成: 1.检查是否有新的东西，如果有: 1.1。获取最
ravendb - 如何修补 RavenDB 中某个类型的所有文档？
我已经更改了我的数据模型，并且需要将所有对象的属性更改为 null，因为在我的模型更改后反序列化它们会引发异常。我猜我可以为每个文档发布一个补丁，但我找不到任何方法来做到这一点，修补某种类型的每个文
ravendb - 来自 RavenDB 空间查询的距离值
有没有办法在进行空间搜索时从 RavenDB 获取距离计算值。我尝试转换建议的 _ = SpatialIndex.Generate(r.Latitude, r.Longitude) 至距离 = Sp
ravendb - 单元测试 RavenDb 查询
是否有一种明智的方法来 stub /模拟调用 IDocumentSession.Query() 的结果？ ? 我有一个命令，我想验证在对象上调用了方法(即正在测试的“单元”是命令，而不是命令编排的对象
ravendb - 如何在 RavenDB 中实现非规范化引用
我想在存储在 RavenDB 文档数据库中的两个实体之间有一个引用。由于这不是关系数据库，我知道我应该使用 RavenDBs 文档中描述的非规范化引用技术。虽然起初这看起来不错，但一旦我开始创建一个真
ravendb - 在不查询的情况下通过键以外的属性检索 RavenDB 文档
是否可以使用返回单个文档但不是关键的属性从数据存储加载(而不是查询)文档？在我的场景中，我有用户和品牌。品牌是用户，但用户不一定是品牌。每个品牌都有一个 UserId 属性及其 Id。有没有办法通过
ravendb - 如何在 RavenDB 中执行删除和更新操作
通过官方 RavenDB 阅读一个简单的问题 documentation ，我知道您可以使用客户端 API 函数执行这些操作，但不能使用 RQL，或者无论如何都可以使用 RQL 执行。最佳答案您正
ravendb - 按 RavenDB 中的整数列表排序
我正尝试在 RavenDB 中检索我按 int 列表排序的文档。 Queryable = Queryable.OrderBy(dto => SearchIds.IndexOf(dto.Property
ravendb - 有没有可视化工具来查看 RavenDB 数据库？
我刚刚让 RavenDB 开始工作。我意识到我必须启动 RavenDB\packages\RavenDB.1.0.573\server.exe 才能通过以下方式在我的应用程序中访问它: Do
ravendb - 监控 RavenDB 运行状况的最佳方法是什么？
RavenDB 是否有众所周知的做法来检查 RavenDb 的可用性或检查它在任何给定时间的过载程度？我研究了一些 ravendb API 服务。好像没找到关于健康监测的。有没有像官方的 ravend

首页

博学

6Ren·AI

商城

ravendb - 为什么 RavenDB 在索引过程中读取所有文档，而不仅仅是索引使用的集合？