gpt4 book ai didi

python - 获取要在列表上使用的数据帧的索引

转载 作者:太空宇宙 更新时间:2023-11-03 17:36:30 25 4
gpt4 key购买 nike

我正在尝试根据 pandas 数据帧的内容提取列表的元素。这可能最好通过示例来解释:

假设我有一个名为 a 的列表列表

a = [['Lazy', 'Brown', 'Fox'], ['Jumps', 'Over'], ['Big', 'Blue', 'Sea']]

和一个名为 df 的 pandas 数据框,其形式为

Name    Group
A 1
B 1
C 2

我想根据 df 中的 Group 变量对列表 a 建立索引。这样我就会得到一个结果

[['Lazy', 'Brown', 'Fox', 'Jumps', 'Over'], ['Big', 'Blue', 'Sea']]

或者类似的东西。

我更习惯使用 R 来编码,其中这个过程相对直接 - 所以我希望 python 中也是如此,但我还没有找到任何可以帮助我解决这个问题的东西还没有 python 。

最佳答案

您可以将其表示为 groupby/agg operation :

import pandas as pd
a = [['Lazy', 'Brown', 'Fox'], ['Jumps', 'Over'], ['Big', 'Blue', 'Sea']]
df = pd.DataFrame({'Name':list('ABC'), 'Group':[1,1,2]})
df['a'] = a
print(df.groupby(['Group'])['a'].sum())

产量

Group
1 [Lazy, Brown, Fox, Jumps, Over]
2 [Big, Blue, Sea]
Name: a, dtype: object

通过求和进行聚合是有效的,因为两个列表的总和是一个串联列表:

In [322]: ['Lazy', 'Brown', 'Fox'] + ['Jumps', 'Over']
Out[322]: ['Lazy', 'Brown', 'Fox', 'Jumps', 'Over']

关于python - 获取要在列表上使用的数据帧的索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31149123/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com