gpt4 book ai didi

python - 使用 pandas 按日期计算值的频率 - 第二部分

转载 作者:行者123 更新时间:2023-11-30 22:04:11 24 4
gpt4 key购买 nike

我的数据集(dataset1)如下所示:

Date        Company     Weekday

2015-01-01 Company1 Monday

2015-01-02 Company1 Tuesday

2015-01-03 Company1 Wednesday

2015-01-04 Company1 Thursday

2015-12-09 Company2 Monday

2015-12-10 Company2 Tuesday
………………………………………………………………………

2016-01-08 Company3 Wednesday

2016-01-09 Company3 Thursday

然后我应用以下代码:

dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)

应用上述代码后,我得到以下结果:

Index                        0

('Company1', Monday) 80

('Company1', Tuesday) 80

('Company1', Wednesday) 79
………………………………………………………………….

('Company3', Tuesday) 34

我试图隔离计数值高于 50 的所有 dataset2 条目,但当我尝试以下操作时,我遇到了各种错误:

dataset2=dataset2.loc[dataset2[0]>50]

有人可以提意见吗?

最佳答案

使用系列,因此需要:

dataset2 = dataset1.groupby(['Company','Weekday']).size().sort_values(ascending=False)
dataset2 = dataset2[dataset2 > 50]

另一个解决方案是添加 Series.reset_index使用DataFrame的参数name,然后按列count过滤:

dataset2 = (dataset1.groupby(['Company','Weekday'])
.size()
.sort_values(ascending=False)
.reset_index(name='count'))

dataset2 = dataset2[dataset2['count'] > 50]

关于python - 使用 pandas 按日期计算值的频率 - 第二部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53387122/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com