gpt4 book ai didi

scala - 计算 Spark (Scala) 中数据框列中的空值

转载 作者:行者123 更新时间:2023-12-02 00:44:59 26 4
gpt4 key购买 nike

我正在尝试像这样计算 DataFrame 中列中的空值:

df.filter((df(colname) === null) || (df(colname) === "")).count()

colname 中有列的名称。如果列类型为字符串,则此方法工作正常,但如果列类型为整数且存在一些空值,则此代码始终返回 0。为什么会这样?如何更改它以使其工作?

最佳答案

正如在 df.filter((df(colname) === null) || (df(colname) === "")).count() 适用于String 数据类型,但测试表明未处理 null

@Psidom 的回答处理 nullempty处理 NaN

检查 .isNaN 应该可以处理所有三种情况

df.filter(df(colName).isNull || df(colName) === "" || df(colName).isNaN).count()

关于scala - 计算 Spark (Scala) 中数据框列中的空值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44329398/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com