gpt4 book ai didi

scala - 如何将嵌套列添加到 DataFrame

转载 作者:行者123 更新时间:2023-12-01 10:43:13 25 4
gpt4 key购买 nike

我有一个具有以下架构的数据框 df:

root
|-- city_name: string (nullable = true)
|-- person: struct (nullable = true)
| |-- age: long (nullable = true)
| |-- name: string (nullable = true)

我想做的是添加一个嵌套列,比如 car_brand 到我的 person 结构中。我该怎么做?

预期的最终架构如下所示:

root
|-- city_name: string (nullable = true)
|-- person: struct (nullable = true)
| |-- age: long (nullable = true)
| |-- name: string (nullable = true)
| |-- car_brand: string (nullable = true)

最佳答案

您可以解压结构并将其添加到新结构中,同时包括新列。例如,将“bmw”添加到数据框中的所有人可以这样完成:

df.withColumn("person", struct($"person.*", lit("bmw").as("car_brand")))

关于scala - 如何将嵌套列添加到 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49046886/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com