gpt4 book ai didi

python - 将行分组并将行聚合到 Pandas 中的系列或字典列表中

转载 作者:行者123 更新时间:2023-12-04 08:40:29 24 4
gpt4 key购买 nike

我有一个包含 700 万行的数据框,看起来像这样

|    | ID     | VAL1 | VAL2
|---:|:-------|:-----|:----
| 0 | QWERTY | 1 | ABC
| 1 | 123456 | 2 | ABC
| 2 | QWERTY | 3 | ABC
| 3 | QWERTY | 4 | ABC
| 4 | 123456 | 5 | ABC
df = pd.DataFrame(
columns=("ID", "VAL1", "VAl2"),
data=[("QWERTY", 1, "ABC"), ("123456", 2, "ABC"), ("QWERTY", 3, "ABC"), ("QWERTY", 4, "ABC"), ("123456", 5, "ABC")]
)
我想按 ID 分组或将其转换成这样的形状
|    | ID     | GROUPED
|---:|:-------|:------------------------------------------------
| 0 | QWERTY | [{'ID': 'QWERTY', 'VAL1': 1, 'VAl2': 'ABC'}, {'ID': 'QWERTY', 'VAL1': 3, 'VAl2': 'ABC'}, {'ID': 'QWERTY', 'VAL1': 4, 'VAl2': 'ABC'}, ]
| 1 | 123456 | [{'ID': '123456', 'VAL1': 2, 'VAl2': 'ABC'}, {'ID': '123456', 'VAL1': 5, 'VAl2': 'ABC'}]
它应该按 ID 分组,并有一个包含与该 ID 对应的整行的列表。列表中的行可以是 Series 或 Dict。

我试图以这种方式做到这一点
test1 = df.groupby("ID").apply(lambda x: df.iloc[list(x.to_dict()["VAL1"].keys())])
但它扩展了行并创建了多索引,而不是列表或其他东西
              ID  VAL1 VAl2
ID
123456 1 123456 2 ABC
4 123456 5 ABC
QWERTY 0 QWERTY 1 ABC
2 QWERTY 3 ABC
3 QWERTY 4 ABC
有没有办法用 Pandas 做到这一点?
不幸的是,在处理 500 万行时,普通的 python 循环/映射非常慢。

最佳答案

尝试这个

compact_df =  df.groupby('ID').apply(lambda group: group.to_dict(orient='records'))

关于python - 将行分组并将行聚合到 Pandas 中的系列或字典列表中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64592921/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com