gpt4 book ai didi

python - 使用 Pandas 执行时间间隔分析的最佳方法?

转载 作者:太空宇宙 更新时间:2023-11-04 05:28:35 25 4
gpt4 key购买 nike

我正在尝试找到使用 Python 和 Pandas 进行简单时间间隔分析的最佳方法。这只是为了好玩,所以请随时解释答案以帮助我了解更多信息。

我从生成一些随机数据开始。第一个是在 2 个用户的 4 个 session 的总时间段内时间戳频率为 20 秒的日期。用户分别为123和345。

这里模拟的是每20秒快照一次,看用户是否在线。

import pandas as pd

session_one = pd.date_range('2016-01-01', periods=100, freq='20S')
session_two = pd.date_range('2016-02-01', periods=75, freq='20S')
session_three = pd.date_range('2016-01-01', periods=125, freq='20S')
session_four = pd.date_range('2016-02-01', periods=25, freq='20S')

user_one = [session_one, session_two]
user_two = [session_three, session_four]

data = []

for sessions in user_one:
for dates in sessions:
data.append([123,dates])

for sessions in user_two:
for dates in sessions:
data.append([345,dates])

# Make our dataframe with our randomly generated data
df = pd.DataFrame(data=data, columns=['ID', 'Timestamp'])

努力实现

我想测量每个用户记录之间的时间间隔并将其追加回记录。

SQL 方法

我有一个很好的 SQL 方法,但似乎无法复制相互连接的数据集并使用 Pandas 正确地抵消时间。例如,像这样进行 Pandas 合并(连接):

df['Timestamp'] + datetime.timedelta(0,20)

最佳答案

我想你需要groupby每个 UserIDdiff :

df['diff'] = df.groupby('UserID')['Timestamp'].diff()

关于python - 使用 Pandas 执行时间间隔分析的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37910694/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com