gpt4 book ai didi

python - Pandas - 从正态分布中选择值来填充缺失值

转载 作者:行者123 更新时间:2023-12-01 08:51:19 26 4
gpt4 key购买 nike

下面的代码将仅生成正态分布的一个值,并用该相同值填充所有缺失值:

helper_df = df.dropna()
df = df.fillna(numpy.random.normal(loc=helper_df.mean(), scale=numpy.std(helper_df)))

我们可以做什么来为每个缺失值生成一个值?

最佳答案

您可以创建具有正常值的系列。您应该提取正在处理的列中 Nan 值的索引。

df:您的数据框

col:包含 Nan 值的 col

index = df[df.col.isna()].index
value = np.random.normal(loc=data.col.mean(), scale=data.col.std(), size=data.Age.isna().sum())

data.col.fillna(pd.Series(value, index=index), inplace=True)

关于python - Pandas - 从正态分布中选择值来填充缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53104625/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com