gpt4 book ai didi

python - 获取 Pandas 数据框中每一列的唯一值——帮助我创建更小、更易于管理的数据框来执行指标

转载 作者:行者123 更新时间:2023-11-28 22:50:48 25 4
gpt4 key购买 nike

我开始想将 pandas 数据框中的列转换为列表,然后获取唯一值,目的是在 for 循环中迭代这些唯一值,并创建一些较小的数据框。 IE。每个集群一个。然后我想将这些较小的数据帧存储在字典对象中。

@ben 建议我开始一个新问题并询问 pandas 数据帧的 GroupBy 方法来执行此任务?

我的原帖在这里: get list from pandas dataframe column

My Data: 
cluster load_date budget actual fixed_price
A 1/1/2014 1000 4000 Y
A 2/1/2014 12000 10000 Y
A 3/1/2014 36000 2000 Y
B 4/1/2014 15000 10000 N
B 4/1/2014 12000 11500 N
B 4/1/2014 90000 11000 N
C 7/1/2014 22000 18000 N
C 8/1/2014 30000 28960 N
C 9/1/2014 53000 51200 N

例如:对于 cluster_list 中的项目(其中 cluster list 是 cluster 中唯一的一组值)

create a dataframe for cluster a, where budget > X etc

然后对其他集群做同样的事情,并将它们放入字典中。

然后能够从字典中得到某个数据帧,只说 budget > X 的集群 B 的数据帧

GetDf(key):
return dict(key)

提前致谢

最佳答案

这个问题有两个部分。首先,筛选预算 < X:

的那些列
In [11]: df1 = df[df['budget'] > 10000]

In [12]: df1
Out[12]:
cluster load_date budget actual fixed_price
1 A 2/1/2014 12000 10000 Y
2 A 3/1/2014 36000 2000 Y
3 B 4/1/2014 15000 10000 N
4 B 4/1/2014 12000 11500 N
5 B 4/1/2014 90000 11000 N
6 C 7/1/2014 22000 18000 N
7 C 8/1/2014 30000 28960 N
8 C 9/1/2014 53000 51200 N

现在你可以groupby聚类,并得到分组:

In [13]: g = df1.groupby('cluster')

In [14]: g.get_group('A')
Out[14]:
cluster load_date budget actual fixed_price
1 A 2/1/2014 12000 10000 Y
2 A 3/1/2014 36000 2000 Y

注意:如果您真的想要一本字典,那么您可以使用:

In [15]: d = dict(iter(g))

In [16]: d['A']
Out[16]:
cluster load_date budget actual fixed_price
1 A 2/1/2014 12000 10000 Y
2 A 3/1/2014 36000 2000 Y

关于python - 获取 Pandas 数据框中每一列的唯一值——帮助我创建更小、更易于管理的数据框来执行指标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22342568/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com