cassandra获取时间范围内的所有记录-6ren

cassandra获取时间范围内的所有记录

转载作者：行者123 更新时间：2023-12-03 06:39:12

26

4

我必须使用以(user_id，时间戳)作为键的列族。在我的查询中，我想获取给定时间范围内的所有记录，与 user_id 无关。这是确切的表架构:

CREATE TABLE userlog (
  user_id text,
  ts timestamp,
  action text,
  app_type text,
  channel_name text,
  channel_session_id text,
  pid text,
  region_id text,
  PRIMARY KEY (user_id, ts)
)

我尝试运行

SELECT * FROM userlog  WHERE ts >= '2013-01-01 00:00:00+0200' AND  ts <= '2013-08-13 23:59:00+0200' ALLOW FILTERING;

它在包含小数据集的本地 cassandra 安装上运行良好，但失败了

Request did not complete within rpc_timeout.

在包含所有数据的生产系统上。

是否有一个查询(最好是 cql)可以与给定的列族顺利运行，或者我们必须更改设计？

最佳答案

超时是因为 Cassandra 的返回数据时间超过了超时时间(默认为 10 秒)。对于您的查询，Cassandra 将在返回之前尝试获取整个数据集。对于多个记录，这很容易花费比超时更长的时间。

对于产生大量数据的查询，您需要分页，例如

SELECT * FROM userlog WHERE ts >= '2013-01-01 00:00:00+0200' AND  ts <= '2013-08-13 23:59:00+0200' AND token(user_id) > previous_token LIMIT 100 ALLOW FILTERING;

其中 user_id 是之前返回的 user_id。您还需要对 ts 进行分页，以确保获得最后返回的 user_id 的所有记录。

或者，在 Cassandra 2.0.0(刚刚发布)中，分页是透明完成的，因此您的原始查询应该不会超时或手动分页。

ALLOW FILTERING 表示 Cassandra 正在读取您的所有数据，但仅返回指定范围内的数据。仅当范围是大部分数据时，这才有效。如果您想查找例如内的记录5 分钟的时间窗口，这效率非常低。

关于cassandra获取时间范围内的所有记录，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18697725/

26

4

0

文章推荐： javascript - css 和 html 列 - 翻转表格

文章推荐： javascript - Jquery Sortable后如何更新多个td的Id

文章推荐： facebook - 从 Graph API 中删除照片标签

jQuery - "each"范围内？
我有三个 td，并且正在尝试将每个内部的函数限制为仅该 td。我该怎么做呢？使用此代码，它会获取所有 3 个图像并将它们全部插入到 h2 之前: jQuery("td.frontpage_news")
excel - 大约在 Excel 范围内？
这是所需的通用公式:if((b2-b1)=c1,True,False但是，我需要 b2-b1约等于 c1 , 在 5 内大约单位(在本例中为秒)。有没有可以处理这个的函数？最佳答案你也可以试试这个
java - 验证变量在 Java 范围内
我有三个整数，作为命令行参数传入后赋值给变量。我想验证每个整数都在 1-5 范围内。有没有一种方法可以在不使用如下所示的 if 语句的情况下在 Java 中完成此操作？我想避免这样做(注意伪代码):
Javascript:检查一个数字是否在另一个数字的 n 范围内
检查某个变量 X 是否在某个变量 Z 的 n 个数字之内的最简洁方法是什么。n 是任意定义的数字(即 3)。所以我想要 if (z {something} x){ // run code i
Gradle 全局变量不在 buildscript 范围内
我的顶级 build.gradle (Gradle 2.2) 中有类似的东西 ext.repo = "https://my-artifactory-repo" buildscript { re
java - 如何在jsp中将请求对象存储在 session 范围内
我只是在我的 jsp 页面中进行随机技巧和测试。我想使用 Attributes 将 request 范围对象存储在 session 范围对象中。存储后，当尝试从请求属性中提取值(存储在 session
java - 如何将属性值保留在 session 范围内？
我正在使用 Spring 。我有一个外部化属性文件。我正在按如下方式加载它。现在我如何将 session 中的属性作为键值对保存？我尝试编写一个扩展 ServletContextListene
mysql - 获取行数在内连接 rails 范围内
我有以下范围: scope :billable, -> (range_start = nil, range_end = nil) { joins(:bids) .where("au
c# - 如何检测对象是否在 'using' 范围内？
请看我的示例代码: var testObject = new SomeClass(); using (testObject) { //At this point how can the te
c++ - 如何保持在 vector 范围内？
我目前在保持在 vector 范围内时遇到一些问题。在下面的代码中，我试图检查正在检查的数字是否小于或等于它后面的数字 #include #include #include bool fun(
javascript - 迷失在 javascript 范围内
有人可以帮我解决下面的(简化的)代码吗？我试图从幻灯片事件函数中调用 doTheSlide() 函数。我对 JS 范围的理解仍然有点可疑。实现这一目标的正确方法是什么？我收到此错误: Uncaugh
ios - 检查时间是否在 Swift 范围内
如何在 Swift 中检查时间是否在下午 6 点到晚上 11 点之间？我在使用 NSDateFormatter 时遇到了困难，我觉得一定有更简单的方法。最佳答案使用NSCalendar: let
c++ - 将世界保持在视口(viewport)范围内
我目前正在尝试创建一个 2D 横向滚动条，并且我目前有我的“世界”绘图(暂时是一个大白框)，但我无法弄清楚世界地图的边缘与边缘之间的任何关系确保视口(viewport)始终完全被 map 覆盖。我的
c++ - 模板声明不能出现在 block 范围内
我正在学习李普曼，而且我只是在学习。我在这里尝试编写一个代码，该代码将返回 vector 中的最小元素。当我在 Codeblocks 中编译我的代码时，它说:“模板声明不能出现在 block 范围内”
javascript - 范围内 JS 日期对象的百分比
我有三个日期对象。我该如何比较它们才能确定它们之间的相对差异。 oldDate = newDate() - 5; midDate = newDate() - 2.5; newDate = newDat
javascript - 检查变量是否在 Javascript 范围内
我需要检查对象“objCR”是否存在于当前范围内。我尝试使用以下代码。 if(objCR == null) alert("object is not defined"); 让我知道哪里错了。最佳答案
java - 检查ipAddress是否在私有(private)范围内
如何检查 IP 地址是否属于私有(private)类别？ if(isPrivateIPAddress(ipAddress)) { //do something } 如有
javascript - 如何查看用户选择是否在 HTML 范围内
我正在开发一个 Firefox 插件，它可以转换用户通过用户选择突出显示的屏幕温度。转换后，用户选择将替换为 ID 为 alreadyconverted 的 span HTML 元素，其中包含原始温度
Python:有效地检查整数是否在 *many* 范围内
我正在开发一个邮资应用程序，该应用程序需要根据多个邮政编码范围检查整数邮政编码，并根据邮政编码匹配的范围返回不同的代码。每个代码都有多个邮政编码范围。例如，如果邮政编码在 1000-2429、254
excel - 在 Excel 范围内 - 忽略空单元格
我正在使用 excel 范围进行连接:Set rng = Range("A1:A8")如果范围内的单元格之一为空，则会添加一个空格。你如何阻止这个空间被添加？最佳答案假设您在那些非空单元格中有常

首页

博学

6Ren·AI

商城

cassandra获取时间范围内的所有记录