gpt4 book ai didi

dataframe - 查找具有某些缺失值的数据框列的子集

转载 作者:行者123 更新时间:2023-12-04 12:14:55 24 4
gpt4 key购买 nike

给定来自 DataFrames.jl 的以下数据框:

julia> using DataFrames

julia> df = DataFrame(x1=[1, 2, 3], x2=Union{Int,Missing}[1, 2, 3], x3=[1, 2, missing])
3×3 DataFrame
Row │ x1 x2 x3
│ Int64 Int64? Int64?
─────┼────────────────────────
1 │ 1 1 1
2 │ 2 2 2
3 │ 3 3 missing
我想查找包含 missing 的列他们的值(value)。
我试过了:
julia> names(df, Missing)
String[]
但这不正确,因为 names函数在传递类型时查找传递类型的子类型。

最佳答案

如果要查找实际包含 missing 的列值(value)用途:

julia> names(df, any.(ismissing, eachcol(df)))
1-element Vector{String}:
"x3"
在这种方法中,我们迭代 df 的每一列数据框并检查它是否至少包含一个缺失值。
如果要查找可能包含缺失值的列,则需要检查它们的元素类型:
julia> names(df, [eltype(col) >: Missing for col in eachcol(df)]) # using a comprehension
2-element Vector{String}:
"x2"
"x3"

julia> names(df, .>:(eltype.(eachcol(df)), Missing)) # using broadcasting
2-element Vector{String}:
"x2"
"x3"

关于dataframe - 查找具有某些缺失值的数据框列的子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69178300/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com