gpt4 book ai didi

Hive:根据相邻行合并或标记多行

转载 作者:行者123 更新时间:2023-12-04 10:45:13 26 4
gpt4 key购买 nike

我有下表,想根据相邻行合并多行。

输入

Input table screenshot

预期产出

enter image description here

逻辑是因为“abc”连接到第一行的“abcd”,“abcd”连接到第二行的“abcde”等等,因此“abc”,“abcd”,“abcde”,“abcdef”连接并放在一个数组中。这同样适用于其余行。连接的相邻行的数量是任意的。

问题是如何使用没有任何 UDF 的 Hive 脚本来做到这一点。我是否必须使用 Spark 进行此类操作?非常感谢。

我的一个想法是首先将行标记为

enter image description here

如何仅使用 Hive 脚本来做到这一点?

最佳答案

这是一个 CONNECT BY 查询示例,与 DB2 或 ORACLE 等人不同,HIVE 或 SPARK 不支持该查询。

您可以使用 Spark Scala 模拟这样的查询,但它远非得心应手。放入标签意味着问题的相关性较低,imo。

关于Hive:根据相邻行合并或标记多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59737350/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com