- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图确定一个标识符是否在给定的月份中首先出现(即它是标识符列表中的"new")。下面是第一次尝试,但它标记了标识符 a3
与 2020 年 2 月 28 日相同,尽管它在 2020 年 1 月 31 日不在列表中。
请注意,这是一个简化的示例:在实践中,我会按列进行更多分组,而不仅仅是日期,我需要检查标识符是否是由日期、行业、年龄组合创建的“单元格”的新标识符等。可能有很多。
import pandas as pd, numpy as np
data = """
date identifier value
31-Dec-2019 a1 10
31-Dec-2019 a2 20
31-Dec-2019 a3 30
31-Jan-2020 a1 40
31-Jan-2020 a2 50
31-Jan-2020 a4 60
31-Jan-2020 a5 60
28-Feb-2020 a1 70
28-Feb-2020 a4 80
28-Feb-2020 a3 90
"""
res=[]
for row in [el.split() for el in data.splitlines()][1:]:
rrow=[]
for col in row:
try:
if float(col):
col = np.float32(col)
except:
pass
rrow.append(col)
res.append(rrow)
df = pd.DataFrame(data=res[1:], columns=res[0])
df.date = pd.to_datetime(df.date)
df = df.set_index(["date", "identifier"]).sort_index()
df["valprev"] = df.groupby(level="identifier")["value"].shift(1)
df["isnew"] = df.valprev.isnull(
最佳答案
使用 pd.to_datetime
转换 date
Pandas 专栏 datetime
系列:
df['date'] = pd.to_datetime(df['date'])
然后使用:
s1 = df.groupby('date')['identifier'].value_counts()
s2 = s1.unstack().diff().replace({0: False, np.nan: True}).stack()
df['isnew'] = df.set_index(['date', 'identifier']).index.map(s2)
DataFrame.groupby
在
date
并聚合列
identifier
使用
Groupby.value_counts
:
# print(s1):
date identifier
2019-12-31 a1 1
a2 1
a3 1
2020-01-31 a1 1
a2 1
a4 1
a5 1
2020-02-28 a1 1
a3 1
a4 1
Name: identifier, dtype: int64
使用
Series.unstack
关于系列
s1
至
reshape
然后使用
DataFrame.diff
要计算标识符计数之间的连续差异,此步骤将有助于识别
repeated
的出现。来自
previous month
的标识符, 下次使用
DataFrame.stack
再次将其转换为
MultiLevel
索引系列命名
s2
.
# s1.unstack().diff()
identifier a1 a2 a3 a4 a5
date
2019-12-31 NaN NaN NaN NaN NaN
2020-01-31 0.0 0.0 NaN NaN NaN
2020-02-28 0.0 NaN NaN 0.0 NaN
# print(s2) # this series will be use to map in next step
date identifier
2019-12-31 a1 True
a2 True
a3 True
a4 True
a5 True
2020-01-31 a1 False
a2 False
a3 True
a4 True
a5 True
2020-02-28 a1 False
a2 True
a3 True
a4 False
a5 True
dtype: bool
使用
set_index
设置数据帧的索引
df
如
date
和
identifier
并使用
Series.map
从
s2
的值映射此索引,将此映射值分配给新列
isnew
:
# print(df)
date identifier value isnew
0 2019-12-31 a1 10 True
1 2019-12-31 a2 20 True
2 2019-12-31 a3 30 True
3 2020-01-31 a1 40 False
4 2020-01-31 a2 50 False
5 2020-01-31 a4 60 True
6 2020-01-31 a5 60 True
7 2020-02-28 a1 70 False
8 2020-02-28 a4 80 False
9 2020-02-28 a3 90 True
关于python - 如何检查前几个月列表中是否存在标识符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62951672/
C++ Primer 说: The identifier we define in our programs may not contain 2 consecutive underscores, no
标识符术语在文档 alongside constants 中定义。 , 使用几乎相同的用例,尽管术语在运行时计算它们的值,而常量在编译时得到它。潜在地,这可能会使术语使用全局变量,但这是一个遥远而丑陋
我想知道,.Net 标识符中接受哪些字符? 不是 C# 或 VB.Net,而是 CLR。 我问这个的原因是我正在查看 yield return 语句是如何实现的 (C# In Depth),并看到
在PowerShell中,当我专门使用Active Directory时,通常会编译一个包含一组人群列表的对象,通常使用$x = get-adgroup -filter {name -like "*"
使用 hibernate 时: 我必须为每个实体指定一个 ID 或复合 ID,如果我想使用没有任何主键且没有复合键的表怎么办... 提前致谢 最佳答案 没有键的表不是一个好的关系模型。我不会推荐它。
所以我有一些代码正在尝试编译,但我不断收到此错误: 3SATSolver.java:3: expected 这是代码。我只是没有看到什么吗? import java.util.ArrayList;
我正在寻找有关 C 标准(C99 和/或 C11)部分内容的一些说明,主要是关于标识符的使用。 上下文是一个完整的C99标准库的实现,我希望它完全符合标准。 基本问题是:C 标准允许我在多大程度上声明
我有这个 Shader.h 文件,我正在用这段代码制作它: #include #include #include #include in vec2 TexCoords; out vec4 co
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
这是我的代码: #include "stdafx.h" #include #include #include #include using namespace std; int _tmain(
pthread_create() 的第一个参数是一个thread 对象,用于标识新创建的线程。但是,我不确定我是否完全理解其中的含义。 例如,我正在编写一个简单的聊天服务器并且我计划使用线程。线程会随
我想从我的标识符中获得匹配项。 我在 {/describe:foo} 中有一个这样的字符串,我正在尝试匹配 {/describe:} 以返回 foo,但我没有得到正确的正则表达式,会有人介意指出我做错
我遇到了一个奇怪的问题,我似乎找不到答案,但我想我不妨问问。 我有一个执行碰撞检查的抽象类,它有一个“更新”函数,以及“updateX”和“updateY”函数。 class MapCollidabl
我正在尝试创建一个程序来将所有文件从一个目录复制到另一个目录。但我遇到了一个基本问题。它说当我尝试在第 52 行编译时需要标识符。 public bool RecursiveCopy() {
1>cb.c(51): error C2061: syntax error : identifier 'SaveConfiguration' 1>cb.c(51): error C2059: synt
我刚刚发现命名变量 arguments 是个坏主意。 var arguments = 5; (function () { console.log(arguments); })(); Outpu
我们对我们的网站进行了安全测试,并发现了一个漏洞。 问题 If the session identifier were known by an attacker who had access to t
为了估计程序在一次内核启动中可以处理多少数据,我尝试使用 cudaMemGetInfo() 获取一些内存信息。但是,编译器告诉我: 错误:标识符“cudaMemGetInfo”未定义 cudaGetD
我发现我需要使用 xpath 查询来定位几乎是 regexp 类型的字符串,但无法看到如何管理它。我正在使用的当前查询是: $result = $xpath->query('//ul/li[sta
我正在创建我的学生计划表的虚拟版本,它基本上可以让你记下你有哪些科目的作业。 这是界面: 用户从组合框中选择主题,并在相邻的备忘录中输入一些注释。完成后,他们将单击“保存”按钮,将其保存到 .ini
我是一名优秀的程序员,十分优秀!