indexing - CQL SELECT 大于对索引非键列的查询-6ren

indexing - CQL SELECT 大于对索引非键列的查询

转载作者：行者123 更新时间：2023-12-04 06:42:04

24

4

EDIT1:在原始问题之后添加了一个案例来描述问题。

我希望查询不属于我的 key 的列。如果我理解正确，我需要在该列上定义二级索引。但是，我希望使用大于条件(不仅仅是相等条件)并且这似乎仍然不受支持。

我错过了什么吗？
你会如何解决这个问题？

我想要的设置:

Cassandra 1.1.6
CQL3

CREATE TABLE Table1(
             KeyA int,
             KeyB int,
             ValueA int,
             PRIMARY KEY (KeyA, KeyB)
           );

CREATE INDEX ON Table1 (ValueA);

SELECT * FROM Table1 WHERE ValueA > 3000;

由于在 Cassandra 1.1.6 中仍然不支持在带有复合键的 ColumnFamilies 上定义二级索引，因此我必须解决删除其中一个键的临时解决方案，但我仍然遇到与非相等条件相同的问题。

有没有其他方法可以解决这个问题？

感谢您的时间。

相关来源:
http://cassandra.apache.org/doc/cql3/CQL.html#selectStmt
http://www.datastax.com/docs/1.1/ddl/indexes

编辑1

这是一个可以解释问题的案例。正如 rs-atl 所指出的，这可能是数据模型问题。假设我在 stackoverflow 上保留了所有用户的列族。对于每个用户，我保留了一批统计数据(声誉、NumOfAnswers、NumOfVotes...所有这些都是整数)。我想查询这些统计信息以获取相关用户。

CREATE TABLE UserStats(
             UserID int,
             Reputation int,
             NumOfAnswers int,
             .
             .
             .
             A lot of stats...
             .
             .
             .
             NumOfVotes int,
             PRIMARY KEY (UserID)
           );

现在我有兴趣根据这些统计信息切片 UserID。我想要所有拥有超过 10K 声誉的用户，我想要所有回答少于 5 个的用户，等等。

我希望这有帮助。再次感谢。

最佳答案

在 CQL 中，您可以应用 WHERE一旦为它们创建了索引(即二级索引)，所有列上的子句。否则，您将收到以下错误:

Bad Request: No indexed columns present in by-columns clause with Equal operator

不幸的是，即使有二级索引，由于 performance issue，CQL 要求 WHERE 子句在二级索引上至少有一个 EQ。 .

Q: Why is it necessary to always have at least one EQ comparison on secondary indices?

A: Inequalities on secondary indices are always done in memory, so without at least one EQ on another secondary index you will be loading every row in the database, which with a massive database isn't a good idea. So by requiring at least one EQ on an (secondary) index, you hopefully limit the set of rows that need to be read into memory to a manageable size. (Although obviously you can still get into trouble with that as well).

因此，基本上，如果您除了 EQ 比较之外还有任何其他内容，它会加载“以其他方式匹配”您的查询的所有行，并一次检查它们是否匹配。默认情况下不允许这样做，因为它“可能很慢”。 (本质上，索引仅索引“相等”，而不是像 < 和 > 这样的关系数据库上的索引)。

需要注意的一件事是，如果您在二级索引上有多个非 EQ 条件，您还需要包括 ALLOW FILTERING查询中的关键字，否则你会得到

Cannot execute this query as it might involve data filtering and thus may have unpredictable performance. If you want to execute this query despite the performance unpredictability, use ALLOW FILTERING

一种简单的解决方法是将一个虚拟列附加到您的表中，其中所有行在该列上都具有相同的值。因此，在这种情况下，您可以仅对所需的列执行范围查询。请务必意识到，在 NoSQL 数据库上进行此类查询可能会使系统变慢/陷入困境。

示例

cqlsh:demo> desc table table1;

CREATE TABLE table1 (
  keya int,
  keyb int,
  dummyvalue int,
  valuea int,
  PRIMARY KEY (keya, keyb)
) ....

cqlsh:demo> select * from Table1;

 keya | keyb | dummyvalue | valuea
------+------+------------+--------
    1 |    2 |          0 |      3
    4 |    5 |          0 |      6
    7 |    8 |          0 |      9

在 ValueA 和 DummyValue 上创建二级索引:

cqlsh:demo> create index table1_valuea on table1 (valuea);
cqlsh:demo> create index table1_valueb on table1 (dummyvalue);

在 ValueA 上执行范围查询与 DummyValue=0 :

cqlsh:demo> select * from table1 where dummyvalue = 0 and valuea > 5 allow filtering;

 keya | keyb | dummyvalue | valuea
------+------+------------+--------
    4 |    5 |          0 |      6
    7 |    8 |          0 |      9

关于indexing - CQL SELECT 大于对索引非键列的查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13582673/

24

4

0

文章推荐： multithreading - 多核 J -- 并行化

文章推荐： user-interface - 2013 年更新了 D 的 GUI 库？

文章推荐： android-studio - Android Studio在哪里生成发行版和调试APK？

文章推荐： zend-framework - 使用 Zend_Form 登录的典型问题

C++ 字符串。为什么答案显示字符串 "dog"大于 "cat"，然后 "cat"大于 "dog"？
我不太确定为什么较大字符串(“cat”和“dog”)的答案不一致。我正在用链接列表和模板的使用做一些事情。我的好奇心促使我修改模板和函数重载。如果有人能解释发生了什么，我将不胜感激。谢谢你。 #inc
MySQL 大于 IN
目前我必须编写这样的查询 SELECT * FROM table WHERE value1 > 5000 OR value2 > 5000 OR value3 > 5000 OR value4 > 5
SQL 大于、等于和小于
我想创建一个如下所示的查询，但我不确定如何正确编码，我希望它在开始时间的 1 小时内返回所有预订，这是我想出的: SELECT BookingId, StartTime FROM Booking W
JavaScript:小于 + 大于
这个问题已经有答案了: How to check if a number is between two values? (12 个回答) 已关闭 6 年前。我目前正在 Codecademy 上学习
jquery - 大于/小于问题
我想验证用户输入。如果用户输入的数字大于 3，则应抛出错误“Too high”，如果小于 0.15，则应抛出“Too low”错误。如果它在 3 到 0.15 之间，那么它应该显示“好的”。我的代码
jquery 大于/小于只查看第一个数字？
我有一个拖动脚本，我在其中拖动 div.slider，我正在跟踪 div.slider 的“左”值，并在它大于 68 时让它淡出，但问题是它当它达到 6 而不是 68 时淡出。如果我将数字更改为 85
sql - 如何在数据库中存储小于/大于
是否有一种常见的模式如何在数据库(postgresql)中存储这样的条件，然后以简单的方式从数据库中获取这些数据，并在前端将其与我们在前端的值 SE 进行比较(以获得正确的“值” "): condit
java - 大于/小于在内部工作的程度
如何大于/小于内部工作如果我将 5 与 100 与 5 与 2,147,483,647 (Integer.MAX_VALUE) 进行比较，性能会受到多大影响 5 < 100 and 5 < Inte
mysql:条件语句问题，大于
当我运行此查询时它有效 SELECT sum( amount ) AS balance FROM balance WHERE amount >= 100 但是当我想过滤用户 ID 时，它返回 NULL
MySql 大于 group by
我有下表: account(id, balance, bank_branch) 我想选择账户余额大于其 bank_branch 平均余额的所有账户我试过了 Select id from accoun
java - lucene 大于
你们有没有人知道如何搜索所有大于指定数字的数字？例如:所有单据编号>65 我试过这样:documentNumber: [65 TO *] 但我收到异常，因为 lucene 期望解析一个没有 * 的数
Prolog - 大于 x 的数字
我正在使用 Prolog 算法，并且有一个生成抽象语法树的程序，例如 plus(num(1),num(2))这只是 1+2 .这是通过使用 DCG 来完成的。在这个例子中 plus(num(1),nu
trigonometry - 大于 360 度角的三角比
是否使用 Sin(720) 或 Cos(1440)(以度为单位的角度)？无论是在计算机编程中还是在任何其他情况下？一般来说，是否有任何角度的 Sin/Cosine/Tan 使用大于360？在物
bash - awk 大于 float
我发现了一些与此相关的问题，但没有一个真正回答了我的问题。我有一个像这样的表格文件: 2 10610 0 0 0 0.0105292 2 10649 0 0 0
Prolog 大于/2 成功
我是 Prolog 的新手，我正在尝试解决这个练习: Define a predicate greater_than/2 that takes two numerals in the notation
SQL COUNT* GROUP BY 大于，
我想选择具有出现次数的不同键，此查询似乎有效: SELECT ItemMetaData.KEY, ItemMetaData.VALUE, count(*) FROM ItemMetaData GROU
c - 大于 ULLONG_MAX 的数值
我需要存储和使用大于 ULLONG_MAX 的数值。我需要对这些值进行算术运算，所以我认为存储为 char** 不是一个选项。在这些情况下，有没有办法动态创建额外的 long 前缀？谢谢大家。根
Prolog 大于/2 成功
我是 Prolog 的新手，我正在尝试解决这个练习: Define a predicate greater_than/2 that takes two numerals in the notation
java - 大于 64 位的快速位掩码
处理已知大小但大于 64 位的位掩码(即执行所有位操作)的最有效的数据结构是什么？字节[]？大整数？完全是别的东西吗？需要与 Java 7 兼容，并且对于诸如此类的事情应该很快(或者至少与合理预
java - JTable 大于 JFrame
编辑:抱歉进行了许多编辑。我自己都忘记写了什么了。我使用 JPanel，将 BoxLayout 作为 JFrame 的根面板。我向此根面板添加了另外两个面板:带有 FlowLayou 的 Butto

首页

博学

6Ren·AI

商城

indexing - CQL SELECT 大于对索引非键列的查询