solr - Cassandra 的二级索引 Vs DSE solr 索引-6ren

solr - Cassandra 的二级索引 Vs DSE solr 索引

转载作者：行者123 更新时间：2023-12-04 04:40:26

26

4

我想知道 Cassandra 的二级索引与放置在 CF 上的 DSE solr 索引的性能差异。

我们有一些 CF 没有放置二级索引，因为我们认为二级索引(最终)会导致重读/写 CF 的严重性能问题。我们试图转向 Solr 以允许搜索这些 CF，但看起来加载索引模式会修改 CF 以在感兴趣的列上具有二级索引。

想知道 Solr 索引是否与 Cassandra 的二级索引不同？并且，它最终会导致对具有大数据集和大量读/写的 CF 的缓慢查询(插入/读取)吗？如果是这样，您会建议自定义索引吗(我们想避免)？顺便说一句——我们也在使用(尝试使用)Solr 进行空间搜索。

感谢您提供的任何建议/链接。

更新:为了更好地理解我为什么要问这些问题并看看我是否在问正确的问题——我们的用例描述:

我们正在收集传感器事件——很多!我们将它们存储在时间序列 CF (EventTL) 和 skinny CF (Event) 中。因为我们在 Event CF 中大量写入(插入和更新)，所以我们没有放置任何二级索引。我们现在的查询仅限于通过 Event 的单个事件或通过 EventTL 的事件时间范围(除非我们创建额外的胖 CF 以允许对事件的其他属性进行范围查询)。

这就是 DSE (Solr+Cassandra) 可以帮助我们的地方。我们认为利用 Solr 搜索将使我们能够避免创建额外的胖 CF 以允许搜索事件的其他属性，并允许我们一次搜索多个属性(位置 + 文本/属性)。但是，通过 Solr 为 Event 添加索引模式后，查看 Event CF 的定义如何更改表明创建了二级索引。这导致了这些索引是否会在 Event 中插入/更新行(最终)产生问题的问题。我们需要能够“快速”插入新事件——因为事件可能以每秒 1000+ 的速度进入。

最佳答案

由于您的用例是空间搜索，我认为 Cassandra 的二级索引功能对您不起作用。这是一篇关于二级索引的相当简洁的文章，您可能会觉得有用:http://www.datastax.com/docs/1.1/ddl/indexes

您应该可以使用 Solr 执行此操作。

这是一个应该与您相关的帖子:

http://digbigdata.com/geospatial-search-cassandra-datastax-enterprise/

关于solr - Cassandra 的二级索引 Vs DSE solr 索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18987285/

26

4

0

文章推荐： php - 在 php 中获取已知键的值失败

文章推荐： xcode - 带有属性的 LLDB 类型摘要 (NSManagedObject)

hadoop - DSE 4.7 中奇怪的 dse hive 集成
我正在尝试对现有的 C* 表运行 Hive 查询。这是我的 C* 表定义: drop table IF EXISTS mydata.site_users; CREATE TABLE IF NOT
cassandra - Dse 图模式完整或模式较少
我很困惑 DataStax 图表是架构完整还是架构较少。我问这个问题是因为 getting started tutorial 指示创建架构。但我在边缘属性上插入了随机键值，并且DSE图接受了它，没
java - DSE 图更多线程导致响应时间变慢
我以前问过这个问题。但是再问一个具体的例子。因此，我在我的 Mac 上本地运行了 DSE 图形。我有最简单的顶点创建，下面是遍历。 g.addV("company").property("id",
graph - DSE 图表 - 主机没有及时响应
Gremlin 控制台似乎连接正确，但在任何查询后它都会回复“主机未及时响应”。已经检查: - 远程.yaml - netstat --listen | grep 8182 (不返回任何内容) 小鬼
search - 无法启动 dse solr 节点
我正在 ubuntu 上试用 datastax Enterprise 4.8.4。按照说明安装就OK了。我可以使用命令 sudo service dse start 启动一个 cassandra 节点
cassandra - 需要帮助来理解 DSE Cassandra 文档中的一句话 -
http://www.datastax.com/documentation/cassandra/2.0/cassandra/dml/dml_ltwt_transaction_c.html A SERI
java - 无法在 DSE SOLR 中重新索引
我有 500 万条记录，我只想重新索引 1 个字段。是否有任何方法可以在 DSE Solr 中仅重新索引一个字段(共 5 个字段)。最佳答案简短的回答是否定的，没有办法做到这一点。你想实现什么目
mysql - Sqoop 功能已从 DSE 中删除
我是 Cassandra 新手。在这里，我尝试使用 sqoop 将整个 MYSQL 数据库传输到 cassandra。但完成所有设置后，当我执行以下命令时。 bin/dse sqoop import-
java - DSE Solr : CopyField behavior
我在 Solr schema.xml 中定义了整数字段，如下所示。并复制 Field 定义如下， boolean 类型。我设置了 build_status 值，它是具有以下值的整数。0、1、4
hadoop - DSE 4 分析节点 ~ 它是否并且应该有数据？
我们一直想知道为什么我们的一个集群显示分析节点拥有数据。为了便于阅读，我编辑了 ips、 token 和主机 ID % nodetool status Datacenter: Cassandra ==
docker - 通过 Docker 的本地 DSE 集群
你好，我想构建一个具有 3 个节点的语言环境 dse 集群。我在 docker 容器中按如下方式构建每个 dse 节点 sudo docker pull debian:latest sudo doc
solr - DSE/Solr : Cannot record QUEUE latency
使用 DSE 4.8.7，我们能够每秒将约 1,000 条记录插入到由 Solr 索引的 cassandra 表中。吞吐量有一段时间(可能 30-60 分钟)，直到 2-3 个节点(在 5 节点集群中
cassandra - DSE/Cassandra CQL now() 不适用于时间戳类型
我在使用 now() 函数和 timestamp 类型时遇到问题。请看下面的代码: 表创建: CREATE TABLE "Test" ( video_id UUID, upload_
solr - DSE 3.2 SOLR FileNotFoundException
刚刚使用指南从 3.1 更新到 DSE 3.2 以运行更新，现在日志中充满了这个异常。当通过 SOLR 查询时，我们得到了丢失的数据，但是似乎在使用 cqlsh 或 cli 查询时，数据就在那里。 E
c++ - 生命周期 dse 的 gcc 优化诊断
一些 GCC 优化选项有可选的额外诊断，告诉何时应用给定的优化。例如，-ftree-vectorizer-verbose=2 将说明循环是否已矢量化。我想知道 -flifetime-dse 是否存在
java - 无法启动 DSE 搜索的 solr 方面
我无法启动 DSE 搜索的 solr 方面，并且在执行时收到以下异常消息，当我执行 bin/dse cassandra start 时，cassandra 服务已启动，但没有启动 solr，有没有人可
ubuntu - 安装 dse-full 后 Cassandra 没有出现
我有一个工作的 3 节点 cassandra 集群，我发现在安装过程中我没有安装 dse。所以我在所有三个节点中都安装了 dse-full & opscenter。但是安装后我发现没有一个 cassa
solr - Cassandra 的二级索引 Vs DSE solr 索引
我想知道 Cassandra 的二级索引与放置在 CF 上的 DSE solr 索引的性能差异。我们有一些 CF 没有放置二级索引，因为我们认为二级索引(最终)会导致重读/写 CF 的严重性能问题。
datastax-enterprise - 如何找出特定 DSE 正在运行的 Cassandra 版本？
到目前为止，我还没有在 Datastax 文档网站上找到总结这一点的地方。我可以在服务器上以其他方式轻松检查版本吗？最佳答案打开 cqlsh 并输入 show VERSION . 这给出了 cql
cassandra - DSE 4.7 中 Cassandra 的外部身份验证
我们正在尝试在 DSE 4.7 上对 Cassandra 实现外部身份验证。遵循了一些指南，我们必须扩展 IAuthenticator 类，但在完成之后，关于如何集成的文档较少。我们扩展 IAuth

首页

博学

6Ren·AI

商城

solr - Cassandra 的二级索引 Vs DSE solr 索引