gpt4 book ai didi

java - CQEngine 优化小型数据集

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:26:04 26 4
gpt4 key购买 nike

我有一个应用程序需要对数百万个较小的集合应用灵活的查询,每个集合的大小从 10 到 10000 个项目不等。 CQEngine 在提供查询这些集合的灵 active 方面做得很好,但比以前更严格的实现要慢得多,后者通过对集合中项目的某些属性进行预计算聚合来工作。该方法的问题在于它不够灵活,无法轻松处理新属性的添加。

我的问题是要处理数百万个较小的集合,我可以做些什么来调整 CQEngine 以使其更快。

  1. 我应该添加索引,还是只在集合超过一定大小时才添加索引。
  2. 我目前在记录时间戳上使用 Navigable,在类别或标签等其他属性上使用 HashIndex。

任何想法将不胜感激!

最佳答案

显然这取决于您的查询,但是是的,请查看您正在使用的索引。 Navigable 对于时间戳来说听起来不错,尽管你可以在时间戳的部分上做一个复合(年然后月然后日..等等)

确定cardinality对象的不同属性,并据此确定索引的优先级——对高基数项使用哈希,对较低基数属性使用树。

关于java - CQEngine 优化小型数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39493160/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com