我有一个数据框,其中有两列,时间不同,采用字符串格式,我想找到两列之间的差异,因此我使用以下代码
operational_data_clean['Pick/pack start-time'] = pd.to_datetime(operational_data_clean['Pick/pack start-time'])
operational_data_clean['Flight launched-time'] = pd.to_datetime(operational_data_clean['Flight launched-time'])
operational_data_clean['time_to_launch'] = 0
operational_data_clean['time_to_launch'] = operational_data_clean['Flight launched-time'] - operational_data_clean['Pick/pack start-time']
但是当我第一次运行此代码时,我得到了很好的结果,但是当我第二次运行时,它在“挑选/包装开始时间”和“航类启动时间”值上添加了今天的日期。
如何才能仅将此时间转换为小时,而不获取会扰乱我的数据的日期。
我假设您正在使用 jupyter 笔记本运行代码。
执行代码时,变量 operational_data_clean['Pick/pack start-time']
变为 pd.to_datetime(operational_data_clean['Pick/pack start-time'])
.
因此,当您再次执行该 block 时,jupyter 会记住您的变量,因此将再次执行相同的功能,本质上是这样做的:pd.to_datetime(pd.to_datetime(operational_data_clean['挑选/包装开始时间']))
。
至于 pd.to_datetime()
本身,我建议查看 pandas docs .
我是一名优秀的程序员,十分优秀!