gpt4 book ai didi

c# - 如何优化 RavenDB 查询以检索所有文档?

转载 作者:太空狗 更新时间:2023-10-30 01:06:40 26 4
gpt4 key购买 nike

我正在尝试学习如何使用 RavenDB,为此我创建了一个基本示例。似乎初始化store和查询需要花费大量时间!

static void Main( string[] args )
{
const bool createNewEntities = true;

var sw = new Stopwatch();
using( var store = new EmbeddableDocumentStore {DataDirectory = "~\\Data"} )
{
sw.Start();
store.Initialize();
sw.Stop();
Console.WriteLine( "Initialized in {0} ms.", sw.ElapsedMilliseconds );

if (createNewEntities)
{
sw.Reset();
sw.Start();
using( var session = store.OpenSession() )
{
sw.Stop();
Console.WriteLine();
Console.WriteLine( "Opened session in {0} ms.", sw.ElapsedMilliseconds );

for( var i = 0; i < 10; i++ )
{
var entity = new EntityA( "Entity A " + DateTime.Now.ToLongTimeString() );

sw.Reset();
sw.Start();
session.Store( entity );
sw.Stop();

if (i < 3)
Console.WriteLine( "Stored '{0}' in {1} ms.", entity.Name, sw.ElapsedMilliseconds );
}

sw.Reset();
sw.Start();
session.SaveChanges();
sw.Stop();
Console.WriteLine( "Saved changes in {0} ms.", sw.ElapsedMilliseconds );
}
}


sw.Reset();
sw.Start();
using( var session = store.OpenSession() )
{
sw.Stop();
Console.WriteLine();
Console.WriteLine( "Opened EntityA session in {0} ms.", sw.ElapsedMilliseconds );

sw.Reset();
sw.Start();
var entities = session.Query<EntityA>().ToArray();
sw.Stop();
Console.WriteLine("Queried for all {0} EntityA in {1} ms.", entities.Length, sw.ElapsedMilliseconds);
}


sw.Reset();
sw.Start();
using( var session = store.OpenSession() )
{
sw.Stop();
Console.WriteLine();
Console.WriteLine( "Opened EntityA session (again) in {0} ms.", sw.ElapsedMilliseconds );

sw.Reset();
sw.Start();
var entities2 = session.Query<EntityA>().ToArray();
sw.Stop();
Console.WriteLine( "Queried (again) for all {0} EntityA in {1} ms.", entities2.Length, sw.ElapsedMilliseconds );
}
}


Console.WriteLine();
Console.WriteLine();
Console.WriteLine( "Press ENTER to exit..." );
Console.ReadLine();
}

这会产生以下输出:

Initialized in 6132 ms.Opened session in 3 ms.Stored 'Entity A 08:50:14' in 129 ms.Stored 'Entity A 08:50:15' in 0 ms.Stored 'Entity A 08:50:15' in 0 ms.Saved changes in 29 ms.Opened EntityA session in 0 ms.Queried for all 10 EntityA in 463 ms.Opened EntityA session (again) in 0 ms.Queried (again) for all 10 EntityA in 1 ms.

从这个粗略的例子中,我可以看出:

  • 初始化商店需要大量时间!!
  • 存储第一个实体(共十个)需要相当长的时间。
  • 第一次查询所有实体要花很多时间,但第二次根本不需要时间。

如何正确查询数据库中某种类型 (EntityA) 的所有文档?当然,RavenDB 不可能为每个查询都需要一个索引吗?尤其不适用于没有任何条件的查询?

(注意:我打算使用嵌入在桌面应用程序中的DB,其中列出所有文档用于显示DB的内容。)

最佳答案

以下是三个延迟的原因:

初始化延迟
初始化文档存储确实是最昂贵的操作之一。由于您正在运行 RavenDB 的嵌入式模式,它不仅需要建立与数据库的连接,而且实际上还需要启动数据库运行。在我的机器(一台 2.3Ghz i5 笔记本电脑)上,初始化需要 2516 毫秒。

如果您正在运行一个完整的 RavenDB 服务器(非嵌入式)——大部分延迟将发生在启动服务器本身时。初始化客户端会明显更快。

这是合理的行为,考虑到 IDocumentStore (无论是嵌入的还是普通的)都应保持为单例。在您的应用程序中应该只有一个这样的实例,它应该在启动时创建并在关闭时处理。

首店延迟
因为您没有提供 Id你自己的,Raven 会使用它的 HiLo generation algorithm 自动为你生成一个。 .这涉及从数据库中分配一个可分配的 id block ,这确实需要少量时间。后续调用会更快,因为在 block 用完之前它们不必访问数据库。

如果您自己提供 Id属性并用有效标识符填充它,例如 entities/1 , entities/2等 - 那么它会快得多,因为您将跳过 key 生成。

查询延迟
第一次调用.Query<T>()当您未指定静态索引时,将尝试创建与查询表达式匹配的动态索引。即使在获取“所有”实体时也是如此,因为它仍然必须使用 Raven-Entity-Name 按实体类型进行过滤元数据。 Collections在 RavenDB 中是一个虚拟的东西,由元数据决定。这些文档实际上都在一起 - 因此除了通过元数据查询和过滤之外,没有其他方法可以将所有项目放入“集合”。

您看到的部分延迟是正在构建的动态索引。然后对项目进行索引会有延迟。请注意,如果您添加了更多项目(比如几百个),您仍然会得到大致相同的延迟,但您不会取回所有项目。索引会因为刚刚创建而过时,Raven 只会返回其中的一小部分。在像您这样的测试中,您可能希望明确等待 non-stale results。 .在实际应用程序中,您可能希望预定义一个 static index反而。实际上,您可以通过使用静态索引来加快查询速度。延迟将移至索引创建时间而不是查询时间。

如果你想完全避免使用索引,还有另一种方法:

session.Advanced.LoadStartingWith<EntityA>("EntityAs/");

此方法不使用元数据进行过滤 - 它使用键名本身。它无需查询就可以直接访问文档存储 - 所以速度要快得多。您将需要 paginate获得大量结果 - 但无论如何您都对查询有同样的担忧。但是使用这种方法,默认页面大小要小得多 (25) - 所以你迟早会遇到这种情况。

我希望这能解决您的疑虑。如果您还有其他的,请在评论中告诉我。

关于c# - 如何优化 RavenDB 查询以检索所有文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14786145/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com