gpt4 book ai didi

python - Pandas :分组和重新索引后在行之间操作

转载 作者:太空宇宙 更新时间:2023-11-03 14:51:27 27 4
gpt4 key购买 nike

我有一个包含 1000 行的 pandas 数据框,如下所示:

 x.head()
id jname wbdqueue_id startdatetime \
59 1341127 ondemand_build_baspen-w7g 26581 2017-07-31 23:14:56
60 1341126 ondemand_qa_qforchecka 26581 2017-07-31 23:15:35
61 1341125 ondemand_build_bchecka 26581 2017-07-31 23:14:56
63 1341123 ondemand_build_baspen-w7f 26581 2017-07-31 23:10:05
64 1341122 ondemand_update_waspen-w7a 26581 2017-07-31 23:09:32

enddatetime
59 2017-07-31 23:19:12
60 2017-07-31 23:34:12
61 2017-07-31 23:15:30
63 2017-07-31 23:14:56
64 2017-07-31 23:10:00

对于每个 wbdqueue_id,我想获得 ondemand_update_waspen-w7a 的 startdatetime 和 ondemand_build_baspen-w7g 的 enddatetime 之间的差异。有什么办法吗?

我导入了 CSV 文件并将 startdatetimeenddatetime 都解析为时间。然后我按 wbdqueue_id 分组。我的想法是通过 jname 为每个组编制索引,这样我就可以找到我需要的两个 jname 的开始和结束时间戳。但是当我这样做时,所有其他值都变成 NaN 或 NaT(对于时间列)。

-萨钦

最佳答案

df.set_index('jname').groupby('wbdqueue_id').apply(
lambda x: x.at['ondemand_update_waspen-w7a', 'startdatetime'] \
- x.at['ondemand_build_baspen-w7f', 'enddatetime']
)

wbdqueue_id
26581 -1 days +23:54:36
dtype: timedelta64[ns]

关于python - Pandas :分组和重新索引后在行之间操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45464432/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com