gpt4 book ai didi

python - 如何从DataFrame中获取行 block ?

转载 作者:行者123 更新时间:2023-12-01 00:57:18 25 4
gpt4 key购买 nike

这是引用我的问题的 DataFrame df:

2018-03-04 21:25:19  8.0
2018-03-04 21:26:19 9.0
2018-03-04 21:27:19 9.5
2018-03-04 21:28:19 11.5
2018-03-04 21:29:19 11.9
2018-03-04 21:30:19 12.9
2018-03-04 21:31:19 14.2
2018-03-04 21:32:19 15.2
2018-03-04 21:33:19 15.5
2018-03-04 21:34:19 16.5
2018-03-04 21:35:19 14.8
2018-03-04 21:36:19 13.7
2018-03-04 21:37:19 11.0
2018-03-04 21:38:19 9.9

我有这段代码,可以根据条件从 pandas DataFrame 中检索行。条件是 col1 列的值应在 10 到 15 之间:

lower_bound = 10
upper_bound = 15

s_l=df["col1"].lt(lower_bound)
s_u=df["col1"].gt(upper_bound)

s = s_l | s_u

if (len(s)>0):
df1=df[~s].copy()
if df1.empty:
print(None)
else:
s1=df1.groupby(s.cumsum()).date_time.transform(lambda x : x.max()-x.min()).dt.seconds
print(df1.loc[(s1>1*60)])
else:
print(None)

此函数应识别符合条件的两个行 block :

2018-03-04 21:28:19  11.5
2018-03-04 21:29:19 11.9
2018-03-04 21:30:19 12.9
2018-03-04 21:31:19 14.2

2018-03-04 21:35:19  14.8
2018-03-04 21:36:19 13.7
2018-03-04 21:37:19 11.0

问题是这段代码将它们合并到一个 block 中。我的最终目标是获取第一个 block 的结束时间,即 2018-03-04 21:31:19。我该怎么做?

更新(基于 Quang 的回答):

df1 = df.copy()
s = df1[col].between(10,15)
if (len(s)>0):
df1['block'] = (~s).cumsum()
if df1.empty:
print("None")
else:
new_df = df1[s].reset_index().set_index(['block', 'index'])
s1 = new_df.groupby('block').date_time.transform(lambda x: x.max()-x.min()).dt.seconds
print(new_df[s1>min_duration*60].columns) # date_time is among the columns!
print(new_df[s1>min_duration*60].groupby('block').date_time.last())

错误:

KeyError: 'date_time'

最佳答案

尝试:

s = df['col1'].between(10,15)
df['block'] = (~s).cumsum()
new_df = df[s].reset_index().set_index(['block', 'index'])

输出:

+-------+-------+---------------------+------+
| | | date | col1 |
+-------+-------+---------------------+------+
| block | index | | |
+-------+-------+---------------------+------+
| 3 | 3 | 2018-03-04 21:28:19 | 11.5 |
| | 4 | 2018-03-04 21:29:19 | 11.9 |
| | 5 | 2018-03-04 21:30:19 | 12.9 |
| | 6 | 2018-03-04 21:31:19 | 14.2 |
| 6 | 10 | 2018-03-04 21:35:19 | 14.8 |
| | 11 | 2018-03-04 21:36:19 | 13.7 |
| | 12 | 2018-03-04 21:37:19 | 11.0 |
+-------+-------+---------------------+------+

您可以通过以下方式选择跨度超过 60 秒的 block :

s1 = new_df.groupby('block').date.transform(lambda x: x.max()-x.min()).dt.seconds
new_df[s1>60]

在我的代码中,date 是时间戳列的名称。将其更改为您的实际数据。

关于python - 如何从DataFrame中获取行 block ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56149996/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com