hadoop - Impala查询以获取下一个日期-6ren

hadoop - Impala查询以获取下一个日期

转载作者：行者123 更新时间：2023-12-02 18:28:07

26

4

我有2个Impala表。

第一个表T1(还有其他列，但我只对日期和日期类型感兴趣，如工作日):

date       day_type
04/01/2020 Weekday
04/02/2020 Weekday
04/03/2020 Weekday
04/04/2020 Weekend
04/05/2020 Weekend
04/06/2020 Weekday

第二表T2:

process date       status
A       04/01/2020 finished
A       04/02/2020 finished
A       04/03/2020 finished
A       04/03/2020 run_again

使用Impala查询，我必须从第二个表T2获取最大日期并获取其状态。根据上表，04/03是最大日期。
如果状态在04/03完成，则我的查询应返回T1的下一个可用工作日日期，即04/06/2020。
但是，如果状态为 run_again，则查询应返回相同的日期。
在上表中，04/03具有 run_again，当我的查询运行时，输出应为04/03/2020而不是04/06/2020。
请注意，一个日期可能有多个状态。例如，04/03/2020可以有一行以完成状态作为状态，另一行以运行状态作为状态。在这种情况下，应再次确定运行的优先级，并且查询应给出04/03/2020作为输出日期

到目前为止我尝试过的是:
我从第二个表运行了一个子查询，并获得了最大日期及其状态。我试图在主查询中运行一个案例，并在Case语句中将T1作为子选择提供给它，但它不起作用。

是否可以通过Impala查询来实现？

最佳答案

一种方法是从表T1中创建CTE，而不是相关子查询。就像是:

WITH T3 as (
  select t.date date, min(x.date) next_workday
  from T1 t join T1 x
  on t.date < x.date
  where x.day_type = 'Weekday'
  group by t.date
)
select T2.process, T2.date run_date, T2.status,
  case when T2.status = 'finished' then T3.next_workday
  else T3.date
  end next_run_date
from T2 join T3
on T2.date = T3.date
order by T2.process, T2.date;
+---------+------------+-----------+---------------+
| process | run_date   | status    | next_run_date |
+---------+------------+-----------+---------------+
| A       | 2020-04-01 | finished  | 2020-04-02    |
| A       | 2020-04-02 | finished  | 2020-04-03    |
| A       | 2020-04-03 | run again | 2020-04-03    |
+---------+------------+-----------+---------------+

然后，您可以从结果中选择最大而不是排序。

关于hadoop - Impala查询以获取下一个日期，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61361429/

26

4

0

文章推荐： docker - Azure DevOps 版本 "rzc generate exited with code 1"

文章推荐： asp.net - CheckBoxList不输出标签

文章推荐：触发器的 verilog 表示

文章推荐： docker - x509:证书由未知机构签名:Docker中的Google Storage

impala - Impala 中无效元数据和刷新命令之间的区别？
我看到这个链接影响 Impala version 1.1 : Since Impala 1.1, REFRESH statement only works for existing tables. F
impala - 如何访问 Impala 解析器
Impala 是否重用 hive SQL 解析器？我正在尝试编写一个自定义 Java 代码来检查我的应用程序中的查询正确性。我正在寻找一个可以使用 sql 查询的 api，并让我知道它在语法上对于
impala - 使用 Impala JDBC 驱动程序指定非默认数据库
我正在使用 Impala JDBC 驱动程序(或者我猜它实际上是 Hive Server 2 JDBC 驱动程序)。我在另一个数据库中创建了一个 View ——我们称它为“store55”。假设我的
impala - 如果无效元数据可以做同样的事情，为什么需要在 Impala 中刷新
如果我创建一个表，使用 Hive，在其中插入记录并首先在 Impala 中反射(reflect)同一个表，我必须运行 Invalidate Metadata，它反射(reflect)了执行程序上的元数
impala - 列出需要失效/刷新的 Impala 表
我如何以编程方式找到所有需要 INVALIDATE METADATA 语句的 Impala 表(因为它们是在 Hive 中创建的，但 Impala 尚不知道)或 REFRESH(因为列已添加、已添加数
impala - impala 的 view 或 with 子句是否只计算一次并在查询中多次使用？
with core as ( select t1.a, t1.b, t2.c from test_1 t1 join test_2 t2 on t1.a = t
impala - Presto 和 Impala 之间的基本架构、SQL 合规性和数据使用场景差异是什么？
对于Presto和Impala的区别，有没有专家能从这些角度给出一些简洁的回答？基础架构设计 SQL 合规性真实世界的延迟任何 SPOF 或容错功能结构化和非结构化数据使用场景表现最佳答案
cloudera - 如何使用 impala-shell 或其他方式复制 cloudera impala 表？
当我显示表格时，我在 Impala 中看到一个表格“测试”；我想复制“test”表，使其完全相同，但命名为“test_copy”。我可以执行 impala 查询来执行此操作吗？如果没有，我该怎么做？
hadoop - Impala:使用load inpath加载数据时出错:AccessControlException:粘滞位拒绝了权限:user = impala
所有，我是新手，很少尝试用例。我在hdfs中有一个文件，想加载到impala表中。 -在hdfs上的文件位置:hdfs:// xxx / user / hive / warehouse / imp
r - 在没有 Impala JDBC 驱动程序的情况下从 R 连接到 Impala
由于未公开的原因，我的 Impala 没有安装 JDBC 驱动程序。这使得 connection from R to Impala具有挑战性的。我能够通过 Putty 连接(和查询)到 Impala
hadoop - 如果在 impala statestore 关闭时执行 DDL，为什么 Impala 查询会失败？
在 impala 的官方文档中 here , statestore 组件有一条语句: If you issue a DDL statement while the statestore is down
hadoop - Impala 是否支持用 Impala SQL(不是 C++ 或 Java)编写的用户定义函数？
Impala 确实支持 UDFs written in C++ or Java ，但我有一个由内置函数调用组成的简单公式。我需要在我的代码中使用很多次并且我不想重复它。是否支持类似于以下伪代码的内容
hadoop - 使用什么.. HDFS 上的 Impala 或 Hbase 上的 Impala 或只是 Hbase？
我正在处理概念验证任务。任务是使用 Hadoop 技术实现我们产品的一项功能。功能非常简单，我们有一个 UI，可让您插入有关“网络问题”的详细信息。有关此类问题的所有详细信息都被捕获并插入到 Ora
macos - 在 mac os x 上安装 cloudera impala shell 并连接到 impala 集群
我们在产品上有 impala 服务器，我需要从本地 macbook w/mac os x (10.8) 使用 impala shell 连接到它。我下载了Impala-cdh5.1.0-releas
hadoop - 在 Impala 中使用 Hive UDF 在 Impala 1.2.4 中给出错误结果
我有两个 Java 中的 Hive UDF，它们可以工作在 Hive 中非常好。这两个功能是互补的。 String myUDF(BigInt) BigInt myUDFReverso(String)
impala - 如何检查Impala表中是否存在列？
我在 Impala 中创建了一个外部表。我正在编写一个 shell 脚本，用于检查该表中是否存在特定的列。我们可以使用以下查询在 MySql 中执行此操作。 SELECT * FROM inform
impala - impala是否在查询后缓存一些数据
我是 Impala 的新手，我在 Impala 上做了一些测试用例。当我第二次调用时，我发现类似的 SQL 快得多。例如: table1 = 4B 行 table2 = 5000 万行第一次查询:
cloudera - Impala 数据局部性
我对 impala 中的数据局部性有疑问，假设我有 10 个数据节点的集群(每个数据节点上都有 impalad)，如果我在 impala 中执行查询 SELECT * FROM big_table w
impala - 如何判断一个Impala对象的名字对应一个 View
Impala 中有没有一种方法可以确定 SHOW TABLES 返回的对象名称是否存在？对应于表或 View ，因为: 该语句只返回对象名称，不返回类型 SHOW CREATE VIEW只是 SHOW
hive - Impala:像查询一样显示表
我正在使用 Impala 并使用如下所示的某种模式从数据库中获取表列表。假设我有一个数据库 bank , 该数据库下的表如下所示。 cust_profile cust_quarter1_transa

首页

博学

6Ren·AI

商城

hadoop - Impala查询以获取下一个日期