gpt4 book ai didi

apache-spark - 如何删除一列pyspark中的空行

转载 作者:行者123 更新时间:2023-12-04 02:31:35 24 4
gpt4 key购买 nike

我有一个数据框,我想删除其中一列(字符串)中具有 NULL 值的所有行。我可以很容易地得到它的计数:

df.filter(df.col_X.isNull()).count()

我尝试使用以下命令删除它。它执行但计数仍然返回正数
df.filter(df.col_X.isNull()).drop()

我尝试了不同的尝试,但它返回“对象不可调用”错误。

最佳答案

数据帧是不可变的。因此,仅应用删除非空值的过滤器将创建一个新的数据框,该数据框不会包含具有空值的记录。

df = df.filter(df.col_X. isNotNull())

关于apache-spark - 如何删除一列pyspark中的空行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44163153/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com