gpt4 book ai didi

python - Pandas :计算数字并结合应用的结果

转载 作者:行者123 更新时间:2023-11-28 17:22:26 24 4
gpt4 key购买 nike

我正在尝试对组中的连续零(例如 2 个连续零或 3 个连续零)进行计数,并将结果合并到一个新的数据框中。

raw_data = {'groups': ['x', 'x', 'x', 'x', 'x', 'x', 'x','z','y', 'y', 'y','y', 'y', 'z'],
'runs': [0, 0, 0, 1, 1, 0, 0, 2, 1, 1, 1, 0, 0, 2]}
df = pd.DataFrame(raw_data, columns = ['groups', 'runs'])

上面数据框中的示例,首先我想知道每个组中有多少个 2 个连续零,然后我想知道每个组中有多少个 3 个连续零。

我想要结果(最好在数据框中):

group    2_0s    3_0s
x 1 1
y 1 0
z 0 0

我希望找到一种通用的方法,因为我希望也能够对连续的 1 和 2 执行相同的操作。

谢谢。

最佳答案

您可以使用:

#get original unique sorted values of groups
orig = np.sort(df.groups.unique())
#add new groups for distinguish 0 in one group
df['g'] = (df.runs != df.runs.shift()).cumsum()
#filter only 0 values
df = df[df.runs == 0]
print (df)
groups runs g
0 x 0 1
1 x 0 1
2 x 0 1
5 x 0 3
6 x 0 3
11 y 0 6
12 y 0 6

#get size by groups and g
df = df.groupby(['groups', 'g']).size().reset_index(name='0')
print (df)
groups g 0
0 x 1 3
1 x 3 2
2 y 6 2
#get size by groups and 0, unstack
#reindex by original unique values, add suffix to column names
df1 = df.groupby(['groups','0'])
.size()
.unstack(fill_value=0)
.reindex(orig, fill_value=0)
.add_suffix('_0s')

print (df1)
0 2_0s 3_0s
groups
x 1 1
y 1 0
z 0 0

更通用的解决方案:

df['g'] = (df.runs != df.runs.shift()).cumsum()
df = df.groupby(['groups', 'g', 'runs']).size().reset_index(name='0')
df1 = df.groupby(['groups','runs', '0']).size().unstack(level=[1,2]).fillna(0).astype(int)
print (df1)
runs 0 1 2
0 2 3 2 3 1
groups
x 1 1 1 0 0
y 1 0 0 1 0
z 0 0 0 0 2

关于python - Pandas :计算数字并结合应用的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40757007/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com