python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表-6ren

python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表

转载作者：太空宇宙更新时间：2023-11-04 00:32:17

24

4

这是数据:

df = pd.DataFrame({
    'date':[1,1,2,2,2,3,3,3,4,5],
    'request':[2,2,2,3,3,2,3,3,3,3],
    'users':[1,3,7,1,7,3,4,9,7,9],
    'count':[1,1,2,3,1,3,1,2,1,1]
})

df

   count  date  request  users
0      1     1        2      1
1      1     1        2      3
2      2     2        2      7
3      3     2        3      1
4      1     2        3      7
5      3     3        2      3
6      1     3        3      4
7      2     3        3      9
8      1     4        3      7
9      1     5        3      9

想法是按 count 和 date 分组，并将每隔一列转换为分组值列表。我认为这就像调用 dfgp.agg 一样简单，但事实并非如此。

这就是我想要做的:

   date  request   count   users
0     1        2  [1, 1]  [1, 3]
1     2        2     [2]     [7]
2     2        3  [3, 1]  [1, 7]
3     3        2     [3]     [3]
4     3        3  [1, 2]  [4, 9]
5     4        3     [1]     [7]
6     5        3     [1]     [9]

我是这样做的:

grouped_df = df.groupby(['date', 'request'])

df_new = pd.DataFrame({ 'count' : grouped_df['count'].apply(list), 'users' : grouped_df['users'].apply(list) }).reset_index()

它有效，但我相信必须有更好的方法...可以对分组对象中的所有列起作用的方法。例如，我应该只按 date 分组，解决方案应该有效。我的解决方案将依赖于对列进行硬编码，我不喜欢这样做，因此在这种情况下它会失败。

这是一个一直困扰着我的事情。这应该是一个显而易见的解决方案，但我找不到。有没有更好的办法？

_{调用我所有的 Pandas MVP...}

最佳答案

更好的答案
找到重复发生的地方，相应地拆分和过滤

dups = df.duplicated(['request', 'date'], 'last').values
i = np.where(~dups[:-1])[0] + 1
r, d, c, u = (df[c].values for c in df)

d1 = pd.DataFrame(
    np.column_stack([r[~dups], d[~dups]]), columns=['request', 'date'])
d2 = pd.DataFrame(
    np.column_stack([np.split(c, i), np.split(u, i)]), columns=['count', 'users'])

d1.join(d2)

   date  requeset   count   users
0     1         2  [1, 1]  [1, 3]
1     2         2     [2]     [7]
2     2         3  [3, 1]  [1, 7]
3     3         2     [3]     [3]
4     3         3  [1, 2]  [4, 9]
5     4         3     [1]     [7]
6     5         3     [1]     [9]

回答我感觉很好!
耶! 默认字典

from collections import defaultdict

d = defaultdict(list)

s = df.set_index(['date', 'request']).stack()
[d[k].append(v) for k, v in s.iteritems()];

pd.Series(d).unstack().rename_axis(['date', 'requeset']).reset_index()

   date  requeset   count   users
0     1         2  [1, 1]  [1, 3]
1     2         2     [2]     [7]
2     2         3  [3, 1]  [1, 7]
3     3         2     [3]     [3]
4     3         3  [1, 2]  [4, 9]
5     4         3     [1]     [7]
6     5         3     [1]     [9]

旧答案

f = lambda x: pd.Series(x.values.T.tolist(), x.columns)
df.groupby(['request', 'date'])[['count', 'users']].apply(f).reset_index()

   request  date   count   users
0        2     1  [1, 1]  [1, 3]
1        2     2     [2]     [7]
2        2     3     [3]     [3]
3        3     2  [3, 1]  [1, 7]
4        3     3  [1, 2]  [4, 9]
5        3     4     [1]     [7]
6        3     5     [1]     [9]

无奈的回答!
鞋拔 agg

from ast import liter_eval

df.groupby(['request', 'date']).agg(
    lambda x: str(list(x))
).applymap(literal_eval).reset_index()

   request  date   count   users
0        2     1  [1, 1]  [1, 3]
1        2     2     [2]     [7]
2        2     3     [3]     [3]
3        3     2  [3, 1]  [1, 7]
4        3     3  [1, 2]  [4, 9]
5        3     4     [1]     [7]
6        3     5     [1]     [9]

关于python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45336273/

24

4

0

文章推荐： Python合并moSTLy重复行，将列拆分为其他列

文章推荐： c - 在 C 中读取 "pure"字节

文章推荐： c - GPU 卡在 2 秒后重置

文章推荐： python - 我应该下载哪个语料库来访问 nltk.corpus.words？

Python 这段代码做了什么？列表=列表[列表!=值]
如标题所示，ans_list是一个答案列表，ans_index是一个数字(答案在词汇表中的索引，但与atm无关) 这里生成的 tree.anslist 是什么？ (例如，仅针对第一个)，忽略迭代。 f
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
MySQL 列表 IN 列表
我目前将用户的输入存储在逗号分隔的列表中，如下所示: Userid | Options 1 | 1,2,5 用户在一个数组形式中勾选一组选项，然后用逗号连接起来 1,2,5 然后 MySQ
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将具有一个元素的东西拿走。这与 How do I “flatte
list - 我怎样才能完全展平一个列表(列表(列表)......)
我想知道如何完全展平列表和包含它们的东西。除其他外，我想出了一个解决方案，它可以将具有多个元素的东西滑倒并将它们放回原处，或者在滑倒后将带有一个元素的东西拿走。这与 How do I “flatte
java - 列表<列表<字符串>>到字符串[][]
这个问题已经有答案了: Convert nested list to 2d array (3 个回答) 已关闭 7 年前。 java中有没有快捷方式可以转换 List> 到 String[][] ？
java - 列表<列表<对象>>排序
我在排序时遇到问题 List> 。我创建了一个自定义比较器，在其中编写了对数据进行排序的代码。 public class CustomComparator implements Comparator
java - 列表数组列表转换
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: Java Generics: Cannot cast List to List? 我只是想知道为什么下面的java代
c# - 列表<逗号分隔的字符串> => 列表<字符串>?
试图想出一个 LINQy 方法来做到这一点，但我什么也没想到。我有一个对象列表<>，其中包含一个属性，该属性是逗号分隔的字母代码列表: lst[0].codes = "AA,BB,DD" lst[1
python - 列表 += 元组与列表 = 列表 + 元组
假设我有这些任务: points = [] point = (1, 2) 我怎么会这样做: points += point 它工作得很好，并且给了我点 = [1, 2]。但是，如果我这样做: poin
scala - 将列表[任务[列表[A]]]转换为任务[列表[A]]
如何在 scala 中将 List[Task[List[Header]]] 类型转换为 Task[List[Header]]。我有一个方法返回 Task[List[Header]] 并多次调用 do
java - 如何在Java中获取二维列表的元素？例如，列表<列表<整数>>
如何在 Java 中查找二维列表的元素？我有一个参数为 List> 的函数我想知道如何找到这个列表的行和列。最佳答案如果你喜欢 List> obj 然后你就可以像这样访问 obj.get(cur
java - 列表<列表没有按预期工作
分配 List到 List工作正常。分配 List>到 List>不编译。代码 public class Main { public static void main(String[] a
java - 列表<可序列化> vs 列表
我正在用 Java 编写一个方法，该方法必须接收并迭代 Serializable 的 List。有什么区别: public void myMethod(List list) { } 和 public
java - 通知网格/列表/树内网格/列表/树的更改
我看到很多人想用 mvvm 更新网格/列表/树的一部分，但他们不想刷新整个列表。对于所有遇到此问题的人，我做了以下示例。希望这对你有用。最佳答案这是一个简单的例子。整个代码中最重要的是: Bi
C++ 列表到 Python 列表
我正在为现有的 C++ 库编写包装器，该库使用列表，其中 T 是自定义结构。我被建议使用 vector 而不是列表，但我试图避免修改库。为了更好地理解这个场景，我做了一个简单的应用程序，使用一个列表
java - 列表 VS 列表<基础>
List list List list 这两种声明有什么区别吗？谢谢，最佳答案是的。 List可以包含所有派生自 Base 的不同事物的混合物. List包含同质项(从某种意义上说，它们必须全部
Java 泛型 : List, 列表<对象>、列表
有人可以尽可能详细地解释以下类型之间的区别吗？ List List List 让我更具体一点。我什么时候想使用 // 1 public void CanYouGiveMeAnAnswer(List l
python - 是否有任何 python 模块可以计算(列表，列表)元组的频率？
我有一个元组列表，每个元组都是一对列表。所以我的数据看起来像: mylist = [(['foo', 'bar'], ['bar', 'bar']),(['bar', 'bar'],['bar', '
list - 给定一个 (a * b) 列表，返回一个 (a * b list) 列表
也许是一个时髦的标题，但我遇到了以下问题: 给定一个类型为 (a * b) list 的列表，我想创建一个类型为 (a * b list) list 的新列表。一个例子: 给定列表 let testL

首页

博学

6Ren·AI

商城

python - 将 DataFrameGroupBy 对象中的每个分组列转换为列表