gpt4 book ai didi

python - 选择 PySpark 数据框中的列

转载 作者:太空狗 更新时间:2023-10-29 17:35:46 24 4
gpt4 key购买 nike

我正在寻找一种在 PySpark 中选择数据框列的方法。对于第一行,我知道我可以使用 df.first(),但不确定列是否没有列名。

我有 5 列,想遍历每一列。

+--+---+---+---+---+---+---+
|_1| _2| _3| _4| _5| _6| _7|
+--+---+---+---+---+---+---+
|1 |0.0|0.0|0.0|1.0|0.0|0.0|
|2 |1.0|0.0|0.0|0.0|0.0|0.0|
|3 |0.0|0.0|1.0|0.0|0.0|0.0|

最佳答案

尝试这样的事情:

df.select([c for c in df.columns if c in ['_2','_4','_5']]).show()

关于python - 选择 PySpark 数据框中的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46813283/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com