gpt4 book ai didi

python - 如何在每个组中估算 Pandas 数据框中的一列

转载 作者:行者123 更新时间:2023-12-03 20:19:30 25 4
gpt4 key购买 nike

<分区>

全部,

我有四列数据框(“key1”、“key2”、“data1”、“data2”)。我在 data1 中插入了一些 nan。现在我想在执行 groupby(['key1', 'key2']) 之后用每个组中出现次数最多的值填充 nan。

dt =  pd.DataFrame ({'key1': np.random.choice(['a', 'b'], size=100),
'key2': np.random.choice(['c', 'd'], size=100),
'data1': np.random.randint(5, size=100),
'data2': np.random.randn(100)},
columns = ['key1', 'key2','data1', 'data2'])
#insert nan
dt['data1'].ix[[2,6,10]]= None
# group by key1 and key2
group =dt.groupby(['key1', 'key2'])['data1']

group.value_counts(dropna=False)
key1 key2 data1
a c 1.0 8
4.0 6
0.0 4
2.0 2
3.0 1
d 0.0 7
1.0 6
4.0 6
2.0 5
NaN 3
3.0 1
b c 0.0 7
2.0 7
1.0 3
3.0 2
4.0 2
d 2.0 11
1.0 10
0.0 3
3.0 3
4.0 3

我想做的是,对于这个例子,用 0.0(组(key1=a,key2=d)中最频繁的值)填充 data1 列中的 nan。

非常感谢您的帮助!

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com