gpt4 book ai didi

python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表

转载 作者:太空宇宙 更新时间:2023-11-04 00:32:17 24 4
gpt4 key购买 nike

这是数据:

df = pd.DataFrame({
'date':[1,1,2,2,2,3,3,3,4,5],
'request':[2,2,2,3,3,2,3,3,3,3],
'users':[1,3,7,1,7,3,4,9,7,9],
'count':[1,1,2,3,1,3,1,2,1,1]
})

df

count date request users
0 1 1 2 1
1 1 1 2 3
2 2 2 2 7
3 3 2 3 1
4 1 2 3 7
5 3 3 2 3
6 1 3 3 4
7 2 3 3 9
8 1 4 3 7
9 1 5 3 9

想法是按 countdate 分组,并将每隔一列转换为分组值列表。我认为这就像调用 dfgp.agg 一样简单,但事实并非如此。

这就是我想要做的:

   date  request   count   users
0 1 2 [1, 1] [1, 3]
1 2 2 [2] [7]
2 2 3 [3, 1] [1, 7]
3 3 2 [3] [3]
4 3 3 [1, 2] [4, 9]
5 4 3 [1] [7]
6 5 3 [1] [9]

我是这样做的:

grouped_df = df.groupby(['date', 'request'])

df_new = pd.DataFrame({ 'count' : grouped_df['count'].apply(list), 'users' : grouped_df['users'].apply(list) }).reset_index()

它有效,但我相信必须有更好的方法...可以对分组对象中的所有 列起作用的方法。例如,我应该只按 date 分组,解决方案应该有效。我的解决方案将依赖于对列进行硬编码,我不喜欢这样做,因此在这种情况下它会失败。

这是一个一直困扰着我的事情。这应该是一个显而易见的解决方案,但我找不到。有没有更好的办法?


调用我所有的 Pandas MVP...

最佳答案

更好的答案
找到重复发生的地方,相应地拆分和过滤

dups = df.duplicated(['request', 'date'], 'last').values
i = np.where(~dups[:-1])[0] + 1
r, d, c, u = (df[c].values for c in df)

d1 = pd.DataFrame(
np.column_stack([r[~dups], d[~dups]]), columns=['request', 'date'])
d2 = pd.DataFrame(
np.column_stack([np.split(c, i), np.split(u, i)]), columns=['count', 'users'])

d1.join(d2)

date requeset count users
0 1 2 [1, 1] [1, 3]
1 2 2 [2] [7]
2 2 3 [3, 1] [1, 7]
3 3 2 [3] [3]
4 3 3 [1, 2] [4, 9]
5 4 3 [1] [7]
6 5 3 [1] [9]

回答我感觉很好!
耶! 默认字典

from collections import defaultdict

d = defaultdict(list)

s = df.set_index(['date', 'request']).stack()
[d[k].append(v) for k, v in s.iteritems()];

pd.Series(d).unstack().rename_axis(['date', 'requeset']).reset_index()

date requeset count users
0 1 2 [1, 1] [1, 3]
1 2 2 [2] [7]
2 2 3 [3, 1] [1, 7]
3 3 2 [3] [3]
4 3 3 [1, 2] [4, 9]
5 4 3 [1] [7]
6 5 3 [1] [9]

旧答案

f = lambda x: pd.Series(x.values.T.tolist(), x.columns)
df.groupby(['request', 'date'])[['count', 'users']].apply(f).reset_index()

request date count users
0 2 1 [1, 1] [1, 3]
1 2 2 [2] [7]
2 2 3 [3] [3]
3 3 2 [3, 1] [1, 7]
4 3 3 [1, 2] [4, 9]
5 3 4 [1] [7]
6 3 5 [1] [9]

无奈的回答!
鞋拔 agg

from ast import liter_eval

df.groupby(['request', 'date']).agg(
lambda x: str(list(x))
).applymap(literal_eval).reset_index()

request date count users
0 2 1 [1, 1] [1, 3]
1 2 2 [2] [7]
2 2 3 [3] [3]
3 3 2 [3, 1] [1, 7]
4 3 3 [1, 2] [4, 9]
5 3 4 [1] [7]
6 3 5 [1] [9]

关于python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45336273/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com