gpt4 book ai didi

pyspark - 如何在数据帧的开头移动 pyspark 数据帧的特定列

转载 作者:行者123 更新时间:2023-12-05 05:07:29 28 4
gpt4 key购买 nike

我有一个 pyspark 数据框如下(这只是一个简化的例子,我的实际数据框有数百列):

col1,col2,......,col_with_fix_header
1,2,.......,3
4,5,.......,6
2,3,........,4

我想在开头移动 col_with_fix_header,这样输出如下:

col_with_fix_header,col1,col2,............
3,1,2,..........
6,4,5,....
4,2,3,.......

我不想列出解决方案中的所有列。

最佳答案

如果您不想列出数据框的所有列,可以使用数据框属性 columns .此属性为您提供列名的 Python 列表,您可以简单地将其切片:

df = spark.createDataFrame([
("a", "Alice", 34),
("b", "Bob", 36),
("c", "Charlie", 30),
("d", "David", 29),
("e", "Esther", 32),
("f", "Fanny", 36),
("g", "Gabby", 60)], ["id", "name", "age"])

df.select([df.columns[-1]] + df.columns[:-1]).show()

输出:

+---+---+-------+
|age| id| name|
+---+---+-------+
| 34| a| Alice|
| 36| b| Bob|
| 30| c|Charlie|
| 29| d| David|
| 32| e| Esther|
| 36| f| Fanny|
| 60| g| Gabby|
+---+---+-------+

关于pyspark - 如何在数据帧的开头移动 pyspark 数据帧的特定列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59106113/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com