gpt4 book ai didi

filter - 如何过滤 pyspark 数据框中的空值?

转载 作者:行者123 更新时间:2023-12-03 23:22:20 25 4
gpt4 key购买 nike

假设我们有一个简单的数据框:

from pyspark.sql.types import *

schema = StructType([
StructField('id', LongType(), False),
StructField('name', StringType(), False),
StructField('count', LongType(), True),
])
df = spark.createDataFrame([(1,'Alice',None), (2,'Bob',1)], schema)

问题是如何检测空值?我尝试了以下方法:
df.where(df.count == None).show()
df.where(df.count is 'null').show()
df.where(df.count == 'null').show()

它导致错误:
condition should be string or Column

我知道以下作品:
df.where("count is null").show()

但是有没有办法在没有完整字符串的情况下实现? IE。 df.count ...?

最佳答案

另一种方法是使用 filter api

from pyspark.sql import functions as F
df.filter(F.isnull("count")).show()

关于filter - 如何过滤 pyspark 数据框中的空值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48008691/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com