sql - 如何在 Spark SQL 中为posexplode 列指定别名？-6ren

sql - 如何在 Spark SQL 中为posexplode 列指定别名？

转载作者：行者123 更新时间：2023-12-03 16:24:08

29

4

当我使用 posexplode() 时，以下语句生成“pos”和“col”作为默认名称Spark SQL 中的函数

scala> spark.sql(""" with t1(select to_date('2019-01-01') first_day) select first_day,date_sub(add_months(first_day,1),1) last_day, posexplode(array(5,6,7)) from t1 """).show(false)
+----------+----------+---+---+
|first_day |last_day  |pos|col|
+----------+----------+---+---+
|2019-01-01|2019-01-31|0  |5  |
|2019-01-01|2019-01-31|1  |6  |
|2019-01-01|2019-01-31|2  |7  |
+----------+----------+---+---+

在 spark.sql 中覆盖这些默认名称的语法是什么？
在数据帧中，这可以通过提供 df.explode(select 'arr.as(Seq("arr_val","arr_pos"))) 来完成。

scala> val arr= Array(5,6,7)
arr: Array[Int] = Array(5, 6, 7)

scala> Seq(("dummy")).toDF("x").select(posexplode(lit(arr)).as(Seq("arr_val","arr_pos"))).show(false)
+-------+-------+
|arr_val|arr_pos|
+-------+-------+
|0      |5      |
|1      |6      |
|2      |7      |
+-------+-------+

如何在 SQL 中得到它？我试过

spark.sql(""" with t1(select to_date('2011-01-01') first_day) select first_day,date_sub(add_months(first_day,1),1) last_day, posexplode(array(5,6,7)) as(Seq('p','c')) from t1 """).show(false)

和

spark.sql(""" with t1(select to_date('2011-01-01') first_day) select first_day,date_sub(add_months(first_day,1),1) last_day, posexplode(array(5,6,7)) as(('p','c')) from t1 """).show(false)

但他们正在抛出错误。

最佳答案

您可以使用 LATERAL VIEW :

spark.sql("""
  WITH t1 AS (SELECT to_date('2011-01-01') first_day)
  SELECT first_day, date_sub(add_months(first_day,1),1) last_day, p, c
  FROM t1
  LATERAL VIEW  posexplode(array(5,6,7)) AS p, c
""").show

+----------+----------+---+---+
| first_day|  last_day|  p|  c|
+----------+----------+---+---+
|2011-01-01|2011-01-31|  0|  5|
|2011-01-01|2011-01-31|  1|  6|
|2011-01-01|2011-01-31|  2|  7|
+----------+----------+---+---+

或别名元组

spark.sql("""
  WITH t1 AS (SELECT to_date('2011-01-01') first_day)
  SELECT first_day, date_sub(add_months(first_day,1),1) last_day,
         posexplode(array(5,6,7)) AS (p, c) 
  FROM t1 
""").show

+----------+----------+---+---+
| first_day|  last_day|  p|  c|
+----------+----------+---+---+
|2011-01-01|2011-01-31|  0|  5|
|2011-01-01|2011-01-31|  1|  6|
|2011-01-01|2011-01-31|  2|  7|
+----------+----------+---+---+

用 Spark 2.4.0 测试。

请注意别名不是字符串，不应该用 ' 引用。或 " .如果必须使用非标准标识符，则应使用反引号，即

WITH t1 AS (SELECT to_date('2011-01-01') first_day)
SELECT first_day, date_sub(add_months(first_day,1),1) last_day,
       posexplode(array(5,6,7)) AS (`arr pos`, `arr_value`) 
FROM t1

关于sql - 如何在 Spark SQL 中为posexplode 列指定别名？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54309042/

29

4

0

文章推荐： Firebase 存储 – 不能删除大小要求

文章推荐： c# - 为客户端 Blazor 部署环境动态配置 Http.BaseAddress

文章推荐： data-structures - 现实生活中的数据结构示例

linux - 无法通过 LAN 从 Windows ping avahi 别名，但可以从其他 Linux VM ping avahi 别名
上下文:我已经在域根上设置了一个用于 GIS 测试和 dokuwiki 的虚拟机服务器。我想在子域上提供 gis Web 应用程序，这样 dokuwiki url 重命名就不会发生冲突(而且感觉更干净
Python 别名
这个问题在这里已经有了答案: If two variables point to the same object, why doesn't reassigning one variable affe
Mysql错误1066不唯一的表/别名
代码如下: Select Branch.BranchName, Sum(Inventory.OnHand) From Inventory, Branch Inventory.BranchNum = B
Javascript 别名
我的目标是创建一种“Javascript 库”，如果您可以这样调用它的话。我打算在浏览网页时使用它来操作页面，将其作为 greasemonkey 脚本动态加载。这个想法是将“win”映射到window
javascript变量引用/别名
是否可以在 javascript 中以某种方式为本地变量分配别名/引用？我的意思是类似 C 的东西: function foo() { var x = 1; var y = &x; y+
16、SQLite 别名
SQLite 别名您可以暂时把表或列重命名为另一个名字，这被称为别名。使用表别名是指在一个特定的 SQLite 语句中重命名表。重命名是临时的改变，在数据库中实际的表的名称不会改变。列别名用来
带点的 typescript 别名
我有以下导入(在同一个 TS 源文件中): import {Vector as sourceVector} from "ol/source"; import {Vector} from "ol/lay
Cmake add_library 别名
我想弄清楚 this 到底是什么行是在这个 github json 项目的 cmake 文件中， add_library(${NLOHMANN_JSON_TARGET_NAME} INTERFACE)
Magento，addAttributeToSelect，别名
使用集合时如何创建别名 (AS)。 $collection->addAttributeToSelect('total_qty') 可以这样做: $collection->getSelect()->co
带参数的 Git 别名
这个问题在这里已经有了答案: Pass an argument to a Git alias command (4 个回答) 去年关闭。我的团队在不同的分支上工作，通常，我需要快速从分支切换来帮助他
用于更改目录的 Vim 别名
我正在寻找一种向我的 vimrc 添加自定义命令或别名的方法，以便快速切换到 Vim 中的不同目录。我曾经设置过一些东西，但丢失了那个配置。这是用于 Linux 设置。基本上，我想设置一个别名(如果
delphi - Firebird 别名
我使用 Delphi 和 Firebird 1.5 开发了一个应用程序，其中服务器与应用程序位于同一台计算机上。我现在正在将应用程序部署到另一个站点，其中 Firebird 服务器( super 服务
javascript - 如何添加导入快捷方式 - 别名
我创建了一个全新的 React 应用 create-react-app demo 我需要为某些目录/组件创建别名，例如: import { Header } from '@uicomponents'
graphviz - DOT语言是否支持变量/别名？
我正在尝试打印有向图，并且不断更改各种节点属性，例如颜色和形状。有什么方法可以使用一次定义并用于多个节点的变量？理想情况下，我想要这样的东西: digraph g { building_color =
nginx 别名+位置指令
server { listen 80; server_name pwta; root html; location /test/{ alia
Javascript:匹配多个对象数组中的对象+别名
我想匹配多个数组，并在匹配时构建另一个数组。该键可以在任意数量的数组中匹配，也可以根本不匹配。 [ [{ 'a': 13 }, { 'b': 62 }, { 'c': 93 }, { 'd': 52
具有多个命令的 Git 别名
经过审查后，我需要更改一些代码并将所有更改代码重新推送到远程分支上。所以我想使用别名(例如:git repushall)在 git 上自动化这些不同的命令: git add . git commit
连接表的 SQL 别名
我有一个这样的查询: select a1.name, b1.info from (select name, id, status from table1 a) as a1 righ
scheme - 别名宏子句的名称
我想给一些 racket 2htdp 函数/宏起别名，这样我就可以为我的 child 将它们翻译成另一种语言。我可以简单地用define给函数起别名。我在使用 big-bang 结构时遇到了麻烦；例
具有多个命令的 Git 别名
经过审查后，我需要更改一些代码并将所有更改代码重新推送到远程分支上。所以我想使用别名(例如:git repushall)在 git 上自动化这些不同的命令: git add . git commit

首页

博学

6Ren·AI

商城

sql - 如何在 Spark SQL 中为posexplode 列指定别名？