gpt4 book ai didi

solr - Cassandra 的二级索引 Vs DSE solr 索引

转载 作者:行者123 更新时间:2023-12-04 04:40:26 26 4
gpt4 key购买 nike

我想知道 Cassandra 的二级索引与放置在 CF 上的 DSE solr 索引的性能差异。

我们有一些 CF 没有放置二级索引,因为我们认为二级索引(最终)会导致重读/写 CF 的严重性能问题。我们试图转向 Solr 以允许搜索这些 CF,但看起来加载索引模式会修改 CF 以在感兴趣的列上具有二级索引。

想知道 Solr 索引是否与 Cassandra 的二级索引不同?并且,它最终会导致对具有大数据集和大量读/写的 CF 的缓慢查询(插入/读取)吗?如果是这样,您会建议自定义索引吗(我们想避免)?顺便说一句——我们也在使用(尝试使用)Solr 进行空间搜索。

感谢您提供的任何建议/链接。

更新:为了更好地理解我为什么要问这些问题并看看我是否在问正确的问题——我们的用例描述:

我们正在收集传感器事件——很多!我们将它们存储在时间序列 CF (EventTL) 和 skinny CF (Event) 中。因为我们在 Event CF 中大量写入(插入和更新),所以我们没有放置任何二级索引。我们现在的查询仅限于通过 Event 的单个事件或通过 EventTL 的事件时间范围(除非我们创建额外的胖 CF 以允许对事件的其他属性进行范围查询)。

这就是 DSE (Solr+Cassandra) 可以帮助我们的地方。我们认为利用 Solr 搜索将使我们能够避免创建额外的胖 CF 以允许搜索事件的其他属性,并允许我们一次搜索多个属性(位置 + 文本/属性)。但是,通过 Solr 为 Event 添加索引模式后,查看 Event CF 的定义如何更改表明创建了二级索引。这导致了这些索引是否会在 Event 中插入/更新行(最终)产生问题的问题。我们需要能够“快速”插入新事件——因为事件可能以每秒 1000+ 的速度进入。

最佳答案

由于您的用例是空间搜索,我认为 Cassandra 的二级索引功能对您不起作用。这是一篇关于二级索引的相当简洁的文章,您可能会觉得有用:http://www.datastax.com/docs/1.1/ddl/indexes

您应该可以使用 Solr 执行此操作。

这是一个应该与您相关的帖子:

http://digbigdata.com/geospatial-search-cassandra-datastax-enterprise/

关于solr - Cassandra 的二级索引 Vs DSE solr 索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18987285/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com