gpt4 book ai didi

python - 如何使用模式/均值来估算 pandas 数据框中的整个缺失值?

转载 作者:行者123 更新时间:2023-12-04 07:58:56 26 4
gpt4 key购买 nike

我知道通过如下每一列分别填写的代码

data['Native Country'].fillna(data['Native Country'].mode(), inplace=True)

但我正在处理一个包含 50 行的数据集,并且有 20 个分类值需要估算。是否有用于估算整个数据集的单行代码??

最佳答案

使用DataFrame.fillnaDataFrame.mode并选择第一行,因为如果返回相同的最大出现次数,则所有值:

data = pd.DataFrame({
'A':list('abcdef'),
'col1':[4,5,4,5,5,4],
'col2':[np.nan,8,3,3,2,3],
'col3':[3,3,5,5,np.nan,np.nan],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')
})

cols = ['col1','col2','col3']

print (data[cols].mode())
col1 col2 col3
0 4 3.0 3.0
1 5 NaN 5.0

data[cols] = data[cols].fillna(data[cols].mode().iloc[0])

print (data)
A col1 col2 col3 E F
0 a 4 3.0 3.0 5 a
1 b 5 8.0 3.0 3 a
2 c 4 3.0 5.0 6 a
3 d 5 3.0 5.0 9 b
4 e 5 2.0 3.0 2 b
5 f 4 3.0 3.0 4 b

关于python - 如何使用模式/均值来估算 pandas 数据框中的整个缺失值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66565971/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com