gpt4 book ai didi

python - 按日/月/年对 pandas 系列日期字符串进行分类的最有效方法?

转载 作者:太空宇宙 更新时间:2023-11-04 00:59:56 25 4
gpt4 key购买 nike

我发现自己经常做类似下面的事情,从一个数据框开始,该数据框有一列字符串格式的日期,我想按一些日历单位(天、月、年等)进行分类。我求助于类似因为我知道 resample 只适用于 DateTimeIndex 系列。

有没有一种更有效的按日期分箱的方法,它在代码方面更简洁和/或处理速度更快?

    build = pd.to_datetime(df.date_build,'%m/%d/%y')
build = pd.DatetimeIndex(build)
final = build.to_series()
one = final.resample('M',how='count')

最佳答案

可以直接按时间列分组:

df.groupby(pd.Grouper(key='date_build', freq='M')).size()

就运行时而言,只是快了一点——所有这些转换操作都非常快。

In [198]: df = pd.DataFrame({'date_build': pd.date_range('1900-1-1', periods=100000)})

In [199]: %timeit pd.DatetimeIndex(df.date_build).to_series().resample('M', how='count')
10 loops, best of 3: 149 ms per loop

In [200]: %timeit df.groupby(pd.Grouper(key='date_build', freq='M')).size()
10 loops, best of 3: 136 ms per loop

关于python - 按日/月/年对 pandas 系列日期字符串进行分类的最有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33307993/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com