- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试定义在不同的移动使用 session 中使用了哪些应用程序。基本上,一个 session 是由一个单个用户在一小段时间范围内创建(也称为 session 增量)。换句话说,如果在前一个 5 分钟内没有发生交互互动,用户的 session 被视为关闭。下一个交互被认为是一个单独的 session 。我想知道数据集中有多少移动 session 。另外,我想知道每个 session 中启动了哪些应用程序。我的数据框中的所有行都带有时间戳。这是数据集中的示例:
timestamp App
6784 2018-04-08 14:31:29.209 Google
6785 2018-04-08 14:58:42.875 Google
6786 2018-04-08 18:18:04.757 Chrome
6787 2018-04-08 21:08:41.368 Google
6788 2018-04-11 10:53:10.744 Google
6789 2018-04-14 19:54:37.441 Google
6790 2018-04-14 19:54:59.833 Google
6791 2018-04-14 19:55:10.844 YouTube
6792 2018-04-14 19:55:34.486 Google
6793 2018-04-14 20:23:00.315 Google
6794 2018-04-15 08:23:44.873 Google
6795 2018-04-15 08:24:07.257 Google
6796 2018-04-16 16:42:35.538 Google
6797 2018-04-16 16:42:48.351 Google
6798 2018-04-17 08:10:54.734 Google
6799 2018-04-17 08:13:28.855 Google
6800 2018-04-17 08:16:49.408 Google
6801 2018-04-17 08:18:55.049 Google
6802 2018-04-17 08:21:04.201 Google
6803 2018-04-17 08:26:14.254 Google
这是期望的输出:
timestamp App SessionID
6784 2018-04-08 14:31:29.209 Google 1
6785 2018-04-08 14:58:42.875 Google 2
6786 2018-04-08 18:18:04.757 Chrome 3
6787 2018-04-08 21:08:41.368 Google 4
6788 2018-04-11 10:53:10.744 Google 5
6789 2018-04-14 19:54:37.441 Google 6
6790 2018-04-14 19:54:59.833 Google 6
6791 2018-04-14 19:55:10.844 YouTube 6
6792 2018-04-14 19:55:34.486 Google 6
6793 2018-04-14 20:23:00.315 Google 7
6794 2018-04-15 08:23:44.873 Google 8
6795 2018-04-15 08:24:07.257 Google 8
6796 2018-04-16 16:42:35.538 Google 9
6797 2018-04-16 16:42:48.351 Google 9
6798 2018-04-17 08:10:54.734 Google 10
6799 2018-04-17 08:13:28.855 Google 10
6800 2018-04-17 08:16:49.408 Google 10
6801 2018-04-17 08:18:55.049 Google 10
6802 2018-04-17 08:21:04.201 Google 10
6803 2018-04-17 08:26:14.254 Google 11
最佳答案
我想你想要 .shift
+ .cumsum()
+1
是因为您的第一行始终是 NaT
的差异,它的计算结果为 False
进行比较,这将否则始终从 0 开始 SessionID
。
import pandas as pd
df['SessionID'] = (df.timestamp-df.timestamp.shift(1) > pd.Timedelta(5, 'm')).cumsum()+1
timestamp App SessionID
6784 2018-04-08 14:31:29.209 Google 1
6785 2018-04-08 14:58:42.875 Google 2
6786 2018-04-08 18:18:04.757 Chrome 3
6787 2018-04-08 21:08:41.368 Google 4
6788 2018-04-11 10:53:10.744 Google 5
6789 2018-04-14 19:54:37.441 Google 6
6790 2018-04-14 19:54:59.833 Google 6
6791 2018-04-14 19:55:10.844 YouTube 6
6792 2018-04-14 19:55:34.486 Google 6
6793 2018-04-14 20:23:00.315 Google 7
6794 2018-04-15 08:23:44.873 Google 8
6795 2018-04-15 08:24:07.257 Google 8
6796 2018-04-16 16:42:35.538 Google 9
6797 2018-04-16 16:42:48.351 Google 9
6798 2018-04-17 08:10:54.734 Google 10
6799 2018-04-17 08:13:28.855 Google 10
6800 2018-04-17 08:16:49.408 Google 10
6801 2018-04-17 08:18:55.049 Google 10
6802 2018-04-17 08:21:04.201 Google 10
6803 2018-04-17 08:26:14.254 Google 11
如果您还有 UserID
,那么您可以实现在时间超过 5 分钟或 userID
更改时递增 ID 的逻辑。这是通过以下方式实现的:
import pandas as pd
data = '''\
1,2018-04-08T09:48:17.573,YouTube
1,2018-04-08T09:47:57.849,Chrome
1,2018-04-08T09:48:28.538,Instagram
1,2018-04-08T09:48:37.381,Maps
2,2018-04-08T09:48:46.680,Netflix
2,2018-04-08T09:48:56.672,Google Play Store
1,2018-04-08T09:56:58.880,Google
1,2018-04-08T09:57:25.461,DB Navigator
1,2018-04-08T11:28:38.762,Google
1,2018-04-08T12:58:31.455,Google
1,2018-04-08T14:31:18.131,Google
1,2018-04-08T14:31:29.209,Google
1,2018-04-08T14:58:42.875,Google
1,2018-04-08T18:18:04.757,Chrome
1,2018-04-08T21:08:41.368,Google
1,2018-04-11T10:53:10.744,Google
1,2018-04-14T19:54:37.441,Google
1,2018-04-14T19:54:59.833,Google
1,2018-04-14T19:55:10.844,YouTube
1,2018-04-14T19:55:34.486,Google
1,2018-04-14T20:23:00.315,Google
2,2018-04-15T08:23:44.873,Google
2,2018-04-15T08:24:07.257,Google'''
df = pd.read_csv(pd.compat.StringIO(data), names=['userID','timestamp','App'],
parse_dates=[1])
df.sort_values(by=['userID','timestamp'], inplace=True)
cond1 = df.timestamp-df.timestamp.shift(1) > pd.Timedelta(5, 'm')
cond2 = df.userID != df.userID.shift(1)
df['SessionID'] = (cond1|cond2).cumsum()
返回:
userID timestamp App SessionID
1 1 2018-04-08 09:47:57.849 Chrome 1
0 1 2018-04-08 09:48:17.573 YouTube 1
2 1 2018-04-08 09:48:28.538 Instagram 1
3 1 2018-04-08 09:48:37.381 Maps 1
6 1 2018-04-08 09:56:58.880 Google 2
7 1 2018-04-08 09:57:25.461 DB Navigator 2
8 1 2018-04-08 11:28:38.762 Google 3
9 1 2018-04-08 12:58:31.455 Google 4
10 1 2018-04-08 14:31:18.131 Google 5
11 1 2018-04-08 14:31:29.209 Google 5
12 1 2018-04-08 14:58:42.875 Google 6
13 1 2018-04-08 18:18:04.757 Chrome 7
14 1 2018-04-08 21:08:41.368 Google 8
15 1 2018-04-11 10:53:10.744 Google 9
16 1 2018-04-14 19:54:37.441 Google 10
17 1 2018-04-14 19:54:59.833 Google 10
18 1 2018-04-14 19:55:10.844 YouTube 10
19 1 2018-04-14 19:55:34.486 Google 10
20 1 2018-04-14 20:23:00.315 Google 11
4 2 2018-04-08 09:48:46.680 Netflix 12
5 2 2018-04-08 09:48:56.672 Google Play Store 12
21 2 2018-04-15 08:23:44.873 Google 13
22 2 2018-04-15 08:24:07.257 Google 13
关于python - 基于 pandas 中的时间戳创建交互 session ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50311201/
在 python 交互中,有没有办法在每次输入命令后自动从 python 文件执行方法? 例如:如果我有一个打印文件信息的方法,但我不想不断调用该方法,我怎样才能让它在 python 交互中的每个命令
当你使用Edge等浏览器或系统软件播放媒体时,Windows控制中心就会出现相应的媒体信息以及控制播放的功能,如图。 SMTC (SystemMedia
我在主菜单上使用标准的剪切,复制,粘贴操作。它们具有快捷键Ctrl-X,Ctrl-C和Ctrl-V。 当我打开模态表单时FindFilesForm.ShowModal,然后所有快捷方式都可以从表单中使
这是我想要实现的目标:打开一个 shell(korn 或 bash,没关系),从那个 shell,我想打开一个 ssh 连接(ssh user@host)。在某些时候,可能会提示我输入密码,或者可能会
我正在测试在C / C++程序中嵌入Python,但是我缺乏理解。 测试程序很简单: 初始化解释器; 从启动Timer的文件中执行python脚本(每0.1秒增加一个变量); 等待5秒(C++); 从
我正在尝试用java创建Excel文件。现在,我正在使用 Apache POI 库创建文件并将其保存到本地驱动器。有没有办法启动 Excel 并填充数据而不将其保存到硬盘驱动器? 最佳答案 考虑 Do
我有一个黑盒函数,它接受大约 10 个整数输入。该函数返回一个 pandas 数据框,我想捕获输出窗口(通过使用 bbwidget.children)并显示在布局中的其他地方。到目前为止,交互/交互似
我正在体验新的 QQuickWidget。我如何在 QQuickWidget 和 C++ 之间进行交互? C++ QQuickWidget *view = new QQuickWidget(); vi
我正在尝试设置一个使用 TWAIN 的 C# 应用程序 example from code project 除了我需要将 Form 转换为 IMessageFilter 和调用 IMessageFil
我想在使用 redis 的 python 中编写应用程序。我用谷歌搜索,但找不到我的问题的任何结果。通常,我这样做: import redis rs = redis.Redis('localhost'
最近做一个小项目,网页中嵌入google maps,输入经纬度坐标可以定位地图位置并加注标记,点击标记获取远端摄像头数据并在视频窗口实现播放。在实际操作过程中,由于经纬度数据和视频登录的用户名密码数
我需要在这里澄清一些事情: 我有一个网站,每次在浏览器中重新加载网站时都会更新两个变量的值。这个页面显然是一个 HTML 页面,但变量是由 javascript 函数更新的。此页面在我的服务器上运行。
我注意到,auto忽略双条件。这是一个简化的示例: Parameter A B : Prop. Parameter A_iff_B : A B. Theorem foo1: A -> B. Proo
使用 interactive使用多个小部件相当简单,例如: interactive(foo, w1=widget1, w2=widget2, ...) 但是,我想使用 VBox 和 HBox 的组合以
我们提供类似于 imagemagick 的浏览器页面 JavaScript,可帮助人们将图像转换为不同大小和格式。但是,它需要网页交互。 是否可以让人们自动进行这种交互——无需将图像发送到我们的服务器
大家好,我正在尝试制作一个具有大量动画和效果的交互式 UI。 但我不知道是否: 核心图形可以支持用户交互(触摸、拖动等) 核心图形支持对象旋转 核心图形可以以任何方式与 UIKit 和核心动画交互 谢
这是获取维基百科上一篇关于高盛的文章的介绍的链接。 http://en.wikipedia.org/w/api.php?action=query&prop=extracts&titles=Goldma
我正在尝试编写一个 AppleScript 来查询 iCal 并在任何日历中查找给定日期的所有事件。 我首先编写了一个简单的脚本,它对给定日历中的每个事件执行一些简单的操作: tell applica
我在我的 hudson 服务器上使用 jira 插件。将代码提交到 svn 时,我的提交注释包含在我的 jira 问题中,但有什么办法可以将注释归因于执行提交的实际人员,而不是让一个全局 jira 用
我正在播放一段视频来装饰我的用户界面。我隐藏了 AV 播放器控件,但用户仍然可以控制视频。例如,他们可以使用滑动手势快进或快退。 这让我特别惊讶,因为 AVPlayerView 上面有一个覆盖 Vie
我是一名优秀的程序员,十分优秀!