gpt4 book ai didi

datetime - Pandas:分组并使用日期时间进行转换

转载 作者:行者123 更新时间:2023-12-01 06:22:35 25 4
gpt4 key购买 nike

我仍然是 Pandas 的初学者,当我在多列(包括 dtype datetime64[ns] 列)上使用 groupby-transform 操作时,偶然发现了一个非常奇怪的行为。

我的(玩具)示例是:

import pandas as pd
df = pd.DataFrame({'date': [pd.datetime(2014,3,17), pd.datetime(2014,3,24), pd.datetime(2014,3,17)], 'hdg_id': [4041,4041,4041],'stock': [1.0,1.0,1.0]})

In[117]: df
Out[117]:
date hdg_id stock
0 2014-03-17 4041 1
1 2014-03-24 4041 1
2 2014-03-17 4041 1

我现在对日期和 hdg_id 进行分组(对于 hdg_id 来说是微不足道的,因为只有一个唯一值,但我需要多个分组来产生结果,我的实际应用当然更复杂):
In[118]: df.groupby(['date', 'hdg_id']).transform(sum)
Out[118]:
stock
0 0.000000e+00
1 4.940656e-324
2 0.000000e+00

这不是我预期的结果。如果我将列日期转换为字符串类型,我会得到我所期望的:
In[129]: df['date']=df['date'].astype(str)
In[131]: df.groupby(['date', 'hdg_id']).transform(sum)
Out[131]:
stock
0 2
1 1
2 2

任何人都可以分享一些内部发生的事情吗?

非常感谢!

最佳答案

有理由使用 .transform(sum) 吗?

你可以这样做:
df.groupby(['date', 'hdg_id']).sum()
enter image description here

关于datetime - Pandas:分组并使用日期时间进行转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31968021/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com