gpt4 book ai didi

python - 将分钟数据转换为每小时数据

转载 作者:行者123 更新时间:2023-12-02 02:06:51 26 4
gpt4 key购买 nike

我有一个数据框,其中有数千个唯一的 id、s 和值,以 5 分钟的时间间隔记录一天。该数据很大,因为它包含数千个唯一 ID 的每日数据。数据样本如下所示:

sample_data.csv

datetime,           Unique_id,   Value
2018-01-28 00:00:00, 105714, 409
2018-01-28 00:05:00, 105714, 409
2018-01-28 00:10:00, 105714, 242
2018-01-28 00:15:00, 105714, 225
.................... ....... ...
2018-01-28 23:55:00, 105714, 225
2018-01-28 00:00:00, 206714, 325
2018-01-28 00:05:00, 206714, 325
2018-01-28 00:10:00, 206714 238
.................... ....... ...
2018-01-28 23:55:00, 206714, 410
  • 我尝试将 5 分钟数据转换为每小时数据,同时以小时为单位聚合最后一列的值 (VALUE)。
  • 转换为小时数时,unique_id 值应相同(不应相加)。

我尝试通过以下方式将分钟转换为小时:

pd.to_datetime(df.datetime, unit='m').dt.strftime('%H:%M')

但我不确定如何并行实现最后一列(VALUE)以小时为单位的聚合值。

预期输出

datetime,           Unique_id,   Value
2018-01-28 01(hours):00(minutes), 105714, Sum of 5 minute values in one hour
2018-01-28 02(hours):00(minutes), 105714, Sum of 5 minute values in one hour

最佳答案

使用Grouper对于按小时聚合,列 Unique_idsum:

df['datetime'] = pd.to_datetime(df['datetime'])
df = df.groupby([pd.Grouper(freq='H', key='datetime'), 'Unique_id']).sum().reset_index()
print (df)
datetime Unique_id Value
0 2018-01-28 00:00:00 105714 1285
1 2018-01-28 00:00:00 206714 888
2 2018-01-28 23:00:00 105714 225
3 2018-01-28 23:00:00 206714 410

关于python - 将分钟数据转换为每小时数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68315348/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com