gpt4 book ai didi

Pyspark : select specific column with its position

转载 作者:行者123 更新时间:2023-12-03 18:21:34 26 4
gpt4 key购买 nike

我想知道如何在数据框中选择带有编号而不是名称的特定列?

在 Pandas 中是这样的:

df = df.iloc[:,2]

这是可能的 ?

最佳答案

您始终可以使用 df.columns[n] 获取列的名称。然后 select它:

df = spark.createDataFrame([[1,2], [3,4]], ['a', 'b'])

选择位置 n 处的列:
n = 1
df.select(df.columns[n]).show()
+---+
| b|
+---+
| 2|
| 4|
+---+

选择除列之外的所有 n :
n = 1

您可以使用 drop :
df.drop(df.columns[n]).show()
+---+
| a|
+---+
| 1|
| 3|
+---+

或者选择手动构造的列名:
df.select(df.columns[:n] + df.columns[n+1:]).show()
+---+
| a|
+---+
| 1|
| 3|
+---+

关于Pyspark : select specific column with its position,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50910399/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com