gpt4 book ai didi

scala - 如何在 Spark 中将数组分解为多列

转载 作者:行者123 更新时间:2023-12-04 09:57:41 24 4
gpt4 key购买 nike

我有一个 Spark 数据框看起来像:

id   DataArray
a array(3,2,1)
b array(4,2,1)
c array(8,6,1)
d array(8,2,4)

我想将此数据框转换为:
id  col1  col2  col3
a 3 2 1
b 4 2 1
c 8 6 1
d 8 2 4

我应该使用什么功能?

最佳答案

使用 apply :

import org.apache.spark.sql.functions.col

df.select(
col("id") +: (0 until 3).map(i => col("DataArray")(i).alias(s"col$i")): _*
)

关于scala - 如何在 Spark 中将数组分解为多列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49499263/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com