gpt4 book ai didi

python - Pandas 日期时间格式

转载 作者:行者123 更新时间:2023-12-01 08:17:01 26 4
gpt4 key购买 nike

目前,我正在处理 220 万条记录。其中两列由 membership_idtxn_time 组成。数据框看起来像 -

membership_id          txn_time
1 2019-02-17 00:00:00.0
2 2018-04-23 00:00:00.0
3 2018-12-17 00:00:00.0
4 2019-02-17 00:00:00.0
5 2018-04-02 00:00:00.0
6 2018-09-10 06:20:58.0
7 2019-01-16 08:11:42.0

我希望数据框看起来像 -

membership_id          txn_time
1 2019-02-17
2 2018-04-23
3 2018-12-17
4 2019-02-17
5 2018-04-02
6 2018-09-10
7 2019-01-16

到目前为止我做了什么 -

df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'], errors='coerce')

但是,它不起作用,并且记录数量高达 220 万条。

提前致谢。

最佳答案

为了提高性能,请使用参数format,然后按 dt.floor 转换为不带时间的日期时间,如果稍后需要通过类似日期时间的函数处理数据会更好:

df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'], 
errors='coerce',
format='%Y-%m-%d %H:%M:%S.%f').dt.floor('d')

或者通过 dt.date 发送到 python dates ,但获取对象:

df_txn['TXN_DATE'] = pd.to_datetime(df_txn['txn_time'], 
errors='coerce',
format='%Y-%m-%d %H:%M:%S.%f').dt.date

关于python - Pandas 日期时间格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54924037/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com