- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有以下 Pandas 表:
name date_time
jon 10/01/2019
jon 11/01/2019
jon 12/01/2019
jon 25/01/2019
sam 03/04/2019
sam 18/04/2019
sam 19/04/2019
sam 29/04/2019
fred 02/02/2019
fred 03/02/2019
fred 12/02/2019
fred 13/02/2019
pandas 中的列类型是 - name 是字符串,date_time 是 datetime64[ns, UTC] 格式
我想创建一个新列,它允许我根据每个用户出现在数据中的日期来确定用户是在一个“ session ”还是另一个“ session ”中。
“ session ”是用户首次记录 date_time 值的前 10 天,前 10 天之后的任何内容都是另一个“ session ”。
这并不意味着每 10 天一个新标识符,这意味着只需要制作 2 个标识符 - 一个用于从第一个 date_time 值开始的前 10 天,一个从第 11 天开始。
我想让这些 session 值是唯一的并且相对于人的名字 - 我可能会使用一些字符串连接来完成它但它应该是这样的:
例如它应该看起来像这样:
name date_time session_identifier
jon 10/01/2019 jon_session_1_id
jon 11/01/2019 jon_session_1_id
jon 12/01/2019 jon_session_1_id
jon 25/01/2019 jon_session_2_id
sam 03/04/2019 sam_session_1_id
sam 18/04/2019 sam_session_2_id
sam 19/04/2019 sam_session_2_id
sam 29/04/2019 sam_session_2_id
fred 02/02/2019 fred_session_1_id
fred 03/02/2019 fred_session_1_id
fred 12/02/2019 fred_session_2_id
fred 13/02/2019 fred_session_2_id
如您所见,以用户 jon 为例:
我想在这里创建一个标识符(我称之为 jon_session_1_id),这在从第一个 date_time 值开始的 10 天内重复 - 这是 10/01/2019 所以 jon_session_1_id 将作为 session_identifier 重复直到20/01/2019 然后它将更改为 jon_session_2_id。
每个 session_id 都与人名相关。
这在 Python 中如何完成?我知道这应该是基于使用引导函数的 when/switch 语句的情况 - 但不确定从哪里开始。
最佳答案
您可能会发现累积差异并应用 lambda
。示例代码如下
df = pd.DataFrame({
'name' : ('jon','jon','jon','jon','sam','sam','sam','sam','fred','fred','fred','fred'),
'date_time' : [datetime.strptime(d, '%d/%m/%Y') for d in ('10/01/2019', '11/01/2019', '12/01/2019', '25/01/2019', '03/04/2019', '18/04/2019', '19/04/2019', '29/04/2019', '02/02/2019', '03/02/2019', '12/02/2019', '13/02/2019')]
})
df = df[['name', 'date_time']]
df = df.sort_values(['name', 'date_time'])
df['diffs'] = df.groupby(['name'])['date_time'].transform(lambda x: x.diff().dt.days)
df = df.groupby(['name','date_time']).sum().groupby('name').cumsum().reset_index()
df['session_identifier'] = df.apply(lambda row : row['name'] + '_session_' + str(2 if row['diffs'] > 10 else 1) + '_id', axis=1)
df
输出是
name date_time diffs session_identifier
0 fred 2019-02-02 0.0 fred_session_1_id
1 fred 2019-02-03 1.0 fred_session_1_id
2 fred 2019-02-12 10.0 fred_session_1_id
3 fred 2019-02-13 11.0 fred_session_2_id
4 jon 2019-01-10 0.0 jon_session_1_id
5 jon 2019-01-11 1.0 jon_session_1_id
6 jon 2019-01-12 2.0 jon_session_1_id
7 jon 2019-01-25 15.0 jon_session_2_id
8 sam 2019-04-03 0.0 sam_session_1_id
9 sam 2019-04-18 15.0 sam_session_2_id
10 sam 2019-04-19 16.0 sam_session_2_id
11 sam 2019-04-29 26.0 sam_session_2_id
关于python - 如何在 pandas 中使用 lead in days 添加标识符列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58916619/
C++ Primer 说: The identifier we define in our programs may not contain 2 consecutive underscores, no
标识符术语在文档 alongside constants 中定义。 , 使用几乎相同的用例,尽管术语在运行时计算它们的值,而常量在编译时得到它。潜在地,这可能会使术语使用全局变量,但这是一个遥远而丑陋
我想知道,.Net 标识符中接受哪些字符? 不是 C# 或 VB.Net,而是 CLR。 我问这个的原因是我正在查看 yield return 语句是如何实现的 (C# In Depth),并看到
在PowerShell中,当我专门使用Active Directory时,通常会编译一个包含一组人群列表的对象,通常使用$x = get-adgroup -filter {name -like "*"
使用 hibernate 时: 我必须为每个实体指定一个 ID 或复合 ID,如果我想使用没有任何主键且没有复合键的表怎么办... 提前致谢 最佳答案 没有键的表不是一个好的关系模型。我不会推荐它。
所以我有一些代码正在尝试编译,但我不断收到此错误: 3SATSolver.java:3: expected 这是代码。我只是没有看到什么吗? import java.util.ArrayList;
我正在寻找有关 C 标准(C99 和/或 C11)部分内容的一些说明,主要是关于标识符的使用。 上下文是一个完整的C99标准库的实现,我希望它完全符合标准。 基本问题是:C 标准允许我在多大程度上声明
我有这个 Shader.h 文件,我正在用这段代码制作它: #include #include #include #include in vec2 TexCoords; out vec4 co
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
这是我的代码: #include "stdafx.h" #include #include #include #include using namespace std; int _tmain(
pthread_create() 的第一个参数是一个thread 对象,用于标识新创建的线程。但是,我不确定我是否完全理解其中的含义。 例如,我正在编写一个简单的聊天服务器并且我计划使用线程。线程会随
我想从我的标识符中获得匹配项。 我在 {/describe:foo} 中有一个这样的字符串,我正在尝试匹配 {/describe:} 以返回 foo,但我没有得到正确的正则表达式,会有人介意指出我做错
我遇到了一个奇怪的问题,我似乎找不到答案,但我想我不妨问问。 我有一个执行碰撞检查的抽象类,它有一个“更新”函数,以及“updateX”和“updateY”函数。 class MapCollidabl
我正在尝试创建一个程序来将所有文件从一个目录复制到另一个目录。但我遇到了一个基本问题。它说当我尝试在第 52 行编译时需要标识符。 public bool RecursiveCopy() {
1>cb.c(51): error C2061: syntax error : identifier 'SaveConfiguration' 1>cb.c(51): error C2059: synt
我刚刚发现命名变量 arguments 是个坏主意。 var arguments = 5; (function () { console.log(arguments); })(); Outpu
我们对我们的网站进行了安全测试,并发现了一个漏洞。 问题 If the session identifier were known by an attacker who had access to t
为了估计程序在一次内核启动中可以处理多少数据,我尝试使用 cudaMemGetInfo() 获取一些内存信息。但是,编译器告诉我: 错误:标识符“cudaMemGetInfo”未定义 cudaGetD
我发现我需要使用 xpath 查询来定位几乎是 regexp 类型的字符串,但无法看到如何管理它。我正在使用的当前查询是: $result = $xpath->query('//ul/li[sta
我正在创建我的学生计划表的虚拟版本,它基本上可以让你记下你有哪些科目的作业。 这是界面: 用户从组合框中选择主题,并在相邻的备忘录中输入一些注释。完成后,他们将单击“保存”按钮,将其保存到 .ini
我是一名优秀的程序员,十分优秀!