gpt4 book ai didi

python - 总结每天 Pandas 的出现次数

转载 作者:IT老高 更新时间:2023-10-28 20:25:35 26 4
gpt4 key购买 nike

我在 pandas 数据框中有这样的数据集:

                                  score
timestamp
2013-06-29 00:52:28+00:00 -0.420070
2013-06-29 00:51:53+00:00 -0.445720
2013-06-28 16:40:43+00:00 0.508161
2013-06-28 15:10:30+00:00 0.921474
2013-06-28 15:10:17+00:00 0.876710

我需要计算发生的测量次数,所以我正在寻找这样的东西:

                                    count
timestamp
2013-06-29 2
2013-06-28 3

我不关心情绪列,我想要每天出现的次数。

最佳答案

如果您的 timestamp 索引是 DatetimeIndex:

import io
import pandas as pd
content = '''\
timestamp score
2013-06-29 00:52:28+00:00 -0.420070
2013-06-29 00:51:53+00:00 -0.445720
2013-06-28 16:40:43+00:00 0.508161
2013-06-28 15:10:30+00:00 0.921474
2013-06-28 15:10:17+00:00 0.876710
'''

df = pd.read_table(io.BytesIO(content), sep='\s{2,}', parse_dates=[0], index_col=[0])

print(df)

所以 df 看起来像这样:

                        score
timestamp
2013-06-29 00:52:28 -0.420070
2013-06-29 00:51:53 -0.445720
2013-06-28 16:40:43 0.508161
2013-06-28 15:10:30 0.921474
2013-06-28 15:10:17 0.876710

print(df.index)
# <class 'pandas.tseries.index.DatetimeIndex'>

你可以使用:

print(df.groupby(df.index.date).count())

产生

            score
2013-06-28 3
2013-06-29 2

注意 parse_dates 参数的重要性。没有它,索引将只是一个 pandas.core.index.Index 对象。在这种情况下,您不能使用 df.index.date

所以答案取决于你没有显示的type(df.index)...

关于python - 总结每天 Pandas 的出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17706109/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com