gpt4 book ai didi

python - 在 Pandas 数据框中随机插入 NA 的值 - 没有行完全丢失

转载 作者:行者123 更新时间:2023-11-28 20:16:40 26 4
gpt4 key购买 nike

如何在 panda 数据框中随机缺失一些值,如 Randomly insert NA's values in a pandas dataframe 但是确保没有行完全设置为缺失值?

编辑: 很抱歉没有再次明确说明这一点(虽然在我提到的问题中):我需要能够指定多少百分比,例如 10%,cells 应该是 NaN(或者更确切地说,尽可能接近现有数据框大小的 10%),而不是,比如说,独立地清除单元格每个细胞的边际概率为 10%。

最佳答案

您可以使用 DataFrame.mask对于 numpy bool 掩码,使用 answer of this my question :

df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9]})

print (df)
A B C
0 1 4 7
1 2 5 8
2 3 6 9

np.random.seed(100)
mask = np.random.choice([True, False], size=df.shape)
print (mask)
[[ True True False]
[False False False]
[ True True True]] -> problematic values - all True

mask[mask.all(1),-1] = 0
print (mask)
[[ True True False]
[False False False]
[ True True False]]

print (df.mask(mask))
A B C
0 NaN NaN 7
1 2.0 5.0 8
2 NaN NaN 9

关于python - 在 Pandas 数据框中随机插入 NA 的值 - 没有行完全丢失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42091018/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com