gpt4 book ai didi

python - 在 pyspark 数据框中的第一个序号位置添加一个新列

转载 作者:行者123 更新时间:2023-12-03 15:49:34 32 4
gpt4 key购买 nike

我有一个 pyspark 数据框,如:

+--------+-------+-------+
| col1 | col2 | col3 |
+--------+-------+-------+
| 25 | 01 | 2 |
| 23 | 12 | 5 |
| 11 | 22 | 8 |
+--------+-------+-------+

我想通过添加这样的新列来创建新的数据框:
+--------------+-------+-------+-------+
| new_column | col1 | col2 | col3 |
+--------------+-------+-------+-------+
| 0 | 01 | 2 | 0 |
| 0 | 12 | 5 | 0 |
| 0 | 22 | 8 | 0 |
+--------------+-------+-------+-------+

我知道我可以通过以下方式添加列:
df.withColumn("new_column", lit(0))

但它最后像这样添加了列:
+--------------+-------+-------+-------------+
| col1 | col1 | col2 | new_column |
+--------------+-------+-------+-------------+
| 25 | 01 | 2 | 0 |
| 23 | 12 | 5 | 0 |
| 11 | 22 | 8 | 0 |
+--------------+-------+-------+-------------+

最佳答案

您可以使用 select 对列重新排序。

df = df.select('new_column','col1','col2','col3')
df.show()

关于python - 在 pyspark 数据框中的第一个序号位置添加一个新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53336781/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com