oracle - 在 Hive SQL 中为每个 ID 查找 3 分钟组-6ren

oracle - 在 Hive SQL 中为每个 ID 查找 3 分钟组

转载作者：可可西里更新时间：2023-11-01 16:42:36

24

4

我有这样的数据，

ID  time
1   9/6/2016 00:01:00
1   9/6/2016 00:01:30
1   9/6/2016 00:02:00
1   9/6/2016 00:04:30
1   9/6/2016 00:05:30
1   9/6/2016 01:05:30
1   9/6/2016 05:05:30
1   9/6/2016 05:06:30
2   9/6/2016 01:55:00
2   9/6/2016 01:56:29
2   9/6/2016 01:57:31
2   9/6/2016 03:55:00
2   9/6/2016 04:13:00
2   9/6/2016 04:15:21

对于每个 ID，我想将一个名为 flag 的新变量设置为 1 并检查时间的第一个值。从第一个时间值开始，我想检查距离第一个条目 3 分钟以内的条目，并将所有内容设置为 1。一旦时间条目超过 3 分钟，我想将标志变量设置为 2，然后再次设置从那时起 3 分钟内检查条目，这需要为每个 ID 继续。我想为每个 ID 找到 3 分钟的组，这样我就可以为每个 ID 形成集合。

我想要的输出是，

ID  time              flag
1   9/6/2016 00:01:00   1
1   9/6/2016 00:01:30   1
1   9/6/2016 00:02:00   1
1   9/6/2016 00:04:30   2
1   9/6/2016 00:05:30   2
1   9/6/2016 01:05:30   2
1   9/6/2016 05:05:30   2
1   9/6/2016 05:06:30   2
2   9/6/2016 01:55:00   1
2   9/6/2016 01:56:29   1
2   9/6/2016 01:57:31   1
2   9/6/2016 03:55:00   2
2   9/6/2016 04:13:00   3
2   9/6/2016 04:15:21   3

此处对于 ID 1，标志设置为 1 并一直检查 3 分钟条目，直到第 3 行，一旦超过 3 分钟，它设置为 2 并再次开始检查 3 分钟条目。对于 ID 2 也是如此。

下面是我试过的，

select ID, time, rank() over (order by time) as rank from table_name;

这是对整个表格的排名。我在想，我们可以为每个 ID 对其进行排名，然后调用第一个值并用剩余值减去它，并在此处编写一个子查询。

有没有更有效的方法来做到这一点？我在这里使用 Hive 查询。任何帮助将不胜感激。

最佳答案

你可以看看 sessonize UDF在 DataFu 中。

此外，还有一篇关于可用的不同选项(hive、pig、python)的好文章 here .

关于oracle - 在 Hive SQL 中为每个 ID 查找 3 分钟组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39375298/

24

4

0

文章推荐： c++ - 引用限定的成员函数作为模板参数？

文章推荐： http - wso2 emm 使用 HTTP 而不是 HTTPS

文章推荐： C++ vector::_M_range_check 错误？

oracle - Oracle 即时客户端和 Oracle 客户端的区别
Oracle 即时客户端和 Oracle 客户端有什么区别？你能给我解释一下吗？谢谢最佳答案 Oracle 客户端带有安装程序和许多可执行文件，例如 sqlplus，tnsping，它是完整而庞大的
oracle - 无需安装 Oracle 客户端即可连接 ORACLE 数据库服务器的替代方案
我正在寻找一个Delphi组件来直接连接到ORACLE数据库服务器，而无需安装oracle客户端。我知道Oracle Data Access (ODAC)来自DevArt 。还有其他组件具有此功能吗
oracle - 使用 Oracle 表作为输入参数编写 Oracle 存储过程
如何编写 Oracle 存储过程，以表 (X) 作为输入参数，并在过程内部使用表 X 来与另一个表 Y 联接？表 X 将包含数千条记录。不希望将表名作为 varchar 传递，然后使用动态 SQL
oracle - 使用 Oracle 表作为输入参数编写 Oracle 存储过程
如何编写 Oracle 存储过程，以表 (X) 作为输入参数，并在过程内部使用表 X 来与另一个表 Y 联接？表 X 将包含数千条记录。不希望将表名作为 varchar 传递，然后使用动态 SQL
oracle - Oracle sql中如何过滤空值
我要过滤COMMENTS属性为空的记录我试过了 SELECT TABLE_NAME, COMMENTS FROM (SELECT TABLE_NAME, COMMENTS FROM (sel
oracle - Oracle 工具的替代下载站点
我要下载 Oracle Instant Client for Linux x86-64 (64-bit)现在有一段时间了。现在我注意到该网站在过去几个月中一直遇到技术问题。要从 Oracle 下载
oracle - 没有安装 Oracle 客户端的 Delphi FireDac + Oracle
有什么方法可以将我的 Delphi 应用程序 (FireDac) 直接连接到 Oracle 数据库？目前可以连接，但需要安装Oracle Client 在 embarcadero 站点 ( http
oracle - where子句中的日期格式-Oracle
我有一张表，其中日期列的数据格式如下:“7/25/2014 12:14:27 AM”。我需要通过放入 where 子句来获取此日期。有人可以建议我该怎么做吗？最佳答案日期(存储在表中)是 repr
oracle - Oracle 中两个事务可以同时修改同一行吗？
如果两个事务试图同时修改同一行会发生什么？通常，一旦行被修改，另一个事务等待直到第一个事务执行提交或回滚。但是，如果他们恰好在同一时刻发送更新请求怎么办？最佳答案答案是否定的。两个事务不能同时修改
oracle - Oracle 模式中具有相同名称的两个索引
我想知道为什么我不能在 Oracle 模式中有两个同名的索引？它抛出一个错误，指出该名称已被使用。我的印象是，由于索引在一个特定的表上，这应该不会导致任何错误，除非我们对同一个表上的两个不同列使用相同
oracle - Oracle sql中的rownum与group by
我需要构建一个查询来按成员和到期日期检索信息组，但我需要为每个成员提供一个序列号.. 例如: 如果成员“A”有 3 条记录要过期，“B”只有 1 条，“C”有 2 条，我需要这样的结果: Number
oracle - Oracle 中的存储过程和独立过程有什么区别？
独立程序 create procedure proc1 ( begin end; ) 存储过程 create package pkg1 ( procedure proc2 begin end; ) 最
oracle - Oracle 中的外键约束问题
在 Oracle 9i 中声明 FK 时遇到问题。我在这里查看了许多关于 SO 和一些在线文档(例如 http://www.techonthenet.com/oracle/foreign_keys/f
oracle - Oracle 序列存储在哪个表空间中？
我和我的同事维护的应用程序在后端有一个 Oracle 数据库。我们正在考虑偶尔以“受限”模式运行应用程序，其中一个数据库表空间设置为只读。我们可以轻松地将必要的表和索引移动到单独的表空间，这些表空间将
oracle - Oracle 的用户定义聚合函数可以定义为用于两列吗？
我想实现一个自定义的回归聚合函数，类似于现有的 REGR_SLOPE . 我要定义的函数需要获取两列作为参数，例如 select T.EMPLOYEE_ID, CUSTOM_REGR_SL
oracle - Oracle 脚本中的错误处理
我已经尝试解决这个问题一段时间了，我认为是时候寻求帮助了。我正在构建一个架构配置脚本，我想添加一些脚本输出和错误处理。这个想法是脚本输出窗口只会向我显示关键消息而没有所有噪音。 Create Temp
oracle - Oracle 批量更新速度慢
在旧的 Oracle 服务器(我被告知是 8i)上使用 JDBC 时，我遇到了一个非常令人困惑和奇怪的问题。我在那里准备了一个表，其中包含大约 10 列、数字、varchars、一个 raw(255)
oracle - Oracle 分区表的唯一索引
我有一张 table Customer_Chronics在 Oracle 11g 中。该表具有三个关键列，如下所示: 分支代码客户 ID 期我已按 branch_code 列表按表分区，现在我进
oracle - oracle 在哪里存储用户定义的异常？
是否有存储用户自定义异常的oracle表？最佳答案没有。与其他变量一样，用户定义的异常在 PL/SQL block 中定义，并且具有 PL/SQL 变量将具有的任何范围。所以，例如 DECLAR
oracle - Oracle 中的序列与标识列
在 oracle 中使用序列并使用 Before insert trigger 自动递增列或使用标识列是否更好，因为它在 Oracle 12 c 中可用？最佳答案无论哪种方式，您都将使用序列。 1

首页

博学

6Ren·AI

商城

oracle - 在 Hive SQL 中为每个 ID 查找 3 分钟组