- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在我的数据集中,我有一个日期列,其中的数据是混合格式的。
YYYY
(例如 2009
)MMM-YY
(例如 Jan-08
)MM/DD/YYYY
(例如 01/15/2006
)如何删除不遵循格式 MM/DD/YYYY
的条目?我不太确定从哪里开始。
下面,我提供了数据的 .head()
作为 dict
。
{'Collection Date': {0: '2001',
1: '2002',
2: '2006',
3: '2/19/2006',
4: '2/28/2006'},
'Complete Genome': {0: 'No', 1: 'No', 2: 'No', 3: 'No', 4: 'No'},
'Country': {0: 'Egypt', 1: 'Egypt', 2: 'Egypt', 3: 'Egypt', 4: 'Egypt'},
'Flu Season': {0: '-N/A-', 1: '-N/A-', 2: '-N/A-', 3: '-N/A-', 4: '-N/A-'},
'Host Species': {0: 'IRD:Human',
1: 'IRD:Human',
2: 'IRD:Bird/Avian',
3: 'IRD:Chicken/Avian',
4: 'IRD:Avian'},
'Protein Name': {0: 'NA', 1: 'NA', 2: 'NA', 3: 'NA', 4: 'HA'},
'Segment': {0: 6, 1: 6, 2: 6, 3: 6, 4: 4},
'Segment Length': {0: 1428, 1: 1449, 2: 1441, 3: 1363, 4: 1707},
'Sequence Accession': {0: 'AJ457944',
1: 'AJ457943',
2: 'GU050304',
3: 'GQ184251',
4: 'KF178948'},
'State/Province': {0: '-N/A-',
1: '-N/A-',
2: '-N/A-',
3: '-N/A-',
4: '-N/A-'},
'Strain Name': {0: '(A/Egypt/84/2001(H1N2))',
1: '(A/Egypt/96/2002(H1N2))',
2: 'A/avian/Egypt/920431/2006(H9N2)',
3: 'A/chicken/Egypt/06207-NLQP/2006(H5N1)',
4: 'A/chicken/Egypt/0626/2006'},
'Subtype': {0: 'H1N2', 1: 'H1N2', 2: 'H9N2', 3: 'H5N1', 4: 'H5N1'}}
最佳答案
与其应用正则表达式来匹配 MM/DD/YYYY,如果你的日期只是 YYYY 或 MMM/YYYY 或 MM/DD/YYYY 那么你可以利用 MM/DD/YYYY 是一个字符串的事实长度 10:
In [8]:
import pandas as pd
pd.set_option('display.notebook_repr_html', False)
df = pd.DataFrame({'date':['01/03/1987', '2003', 'Jan-08', '31/01/2010']})
df
Out[8]:
date
0 01/03/1987
1 2003
2 Jan-08
3 31/01/2010
[4 rows x 1 columns]
In [9]:
df.ix[df.date.str.len() !=10]
Out[9]:
date
1 2003
2 Jan-08
[2 rows x 1 columns]
然后你可以只使用 to_datetime
:
In [16]:
df1 = df.ix[df.date.str.len() !=10]
df1
Out[16]:
date
1 2003
2 Jan-08
[2 rows x 1 columns]
In [17]:
df1.date = pd.to_datetime(df1.date)
df1
Out[17]:
date
1 2003-01-01 00:00:00
2 2014-01-08 00:00:00
[2 rows x 1 columns]
如果您想使用正则表达式进行过滤,只是为了完整性:
df.ix[~df.date.str.contains('(\d{2})[/](\d{2})[/](\d{4})')]
会起作用,注意 ~
这是一个否定
关于python - Pandas :删除日期不符合指定格式的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21556744/
我正在我的 java 作业中使用 GUI,并且我必须指定 JCheckBox 中的其他内容。除了这个小要求,其他的我都完成了。我不太确定如何解决这个问题,我查阅了我的书并尝试在线研究 要求: 一系列复
在各种语言中(我将在这里使用 JavaScript,但我已经在 PHP 和 C++ 中以及可能在其他地方看到过它),似乎有几种构造简单 for 循环的方法。版本 1 如下: var top = doc
有没有一种方法可以使用 CSS 指定每次“小于符号”(在键盘上 M 的右侧)或“大于符号”出现在文本中时,它应该被替换为分别是“小于”或“大于”的实际词? 最佳答案 CSS 不能作用于(不能修改,即)
首先,使用 setspn 命令为用户注册服务主体名称。 setspn -a CS/dummy@abc.com dummyuser setspn -l dummyuser 给出输出为 CS/dummy@
我在指定从 SFSafariViewController 访问时遇到问题,因为它具有与 Safari 浏览器完全相同的用户代理。 我要做的是仅在 webview 内显示图片,如果在普通浏览器上查看,则
我正在尝试用 R 语言在 lavaan 中指定一个奇怪的模型。该模型如下所示: 我的规范尝试如下所示。我发现难以实现的是将观察到的变量的唯一误差固定为唯一项的两个相关性的总和。 例如,项目 y*1,2
我正在构建 API 以将我的 React 应用程序与我的后端服务连接起来,我想使用 typescript 来指定 data 的类型在我的 Axios 请求中。如何在不修改其他字段的情况下更新 Axio
如何为模型指定初始“软”值?该初始模型是解决类似查询的结果,并且该模型很可能具有正确的部分,甚至对于当前查询可能是正确的。 目前,我正在通过增量求解和 hard/soft constraints 对此
我有来自网页的以下代码 https://cwiki.apache.org/confluence/display/KAFKA/0.8.0+Producer+Example 似乎缺少的是如何配置分区数。我
有没有办法在每个查询的基础上在 Neo4jClient 中指定 Cypher 解析器的版本,如 here 所述? 谢谢! 最佳答案 如果您将 Neo4jClient 更新到最新版本(> 1.0.0.6
我有以下代码生成四个图,但它们最终被压扁(见下图)。我该如何解决这个问题? par(mfrow=c(2,2)) curve(.5*exp(-.5*x),from=0,to=10,main="f(x)"
我有一个 ColdFusion 10 服务器。我正在使用 JDBC 驱动程序连接到 db2 数据库。我偶然发现了这个笔记。这个设置在哪里?我还查看了 neo*.xml 文件,但没有看到任何 db 驱动
我想知道是否可以指定验证器的运行顺序。 目前,我编写了一个自定义验证器,检查它是否为 [a-zA-Z0-9]+ 以确保登录验证我们的规则,并编写了一个远程验证器以确保登录可用,但目前远程验证器已启动在
我的应用程序需要至少 40MB 的 RAM,因此早期的 iPhone(例如 3G、第一个 iPod touch 版本)就没有它(它们为我的应用程序提供的最大内存约为 20MB)。有没有正确的方法来禁用
我有一个保存日期(不是当前日期)的 Date 对象,我需要以某种方式指定该日期为 UTC,然后将其转换为“欧洲/巴黎”,即 +1 小时。 public static LocalDateTime toL
我想问你在 Varnish 代码中如何在没有缓存的情况下将请求传递到后端。 我知道我可以做到并且正在发挥作用: if (req.url ~ "(\?|&)(something|somethin
我目前基于模块编译程序(如主程序 foo 依赖于模块 bar )如下: gfortran -c bar.f90 gfortran -o foo.exe foo.f90 bar.o 这在 foo.f90
我正在尝试创建一个依赖于另一个 meteor 包的新 meteor 包。当我尝试 meteor add mypackage 时,出现以下错误。为什么 Meteor 不添加 mypackage 并引入它
我正在制作执行器/ react 器,同时发现这是一个终生的问题。它与 async/Future 无关,可以在没有 async 糖的情况下进行复制。 use std::future::Future; s
我在 cassandra 中有一个表,其数据类型为时间戳。我正在使用 cqlsh 从数据库中获取数据,并希望更改我的时间戳列输出的输出格式。我研究了一下,发现我可以通过更改以下文件来更改时间戳输出格式
我是一名优秀的程序员,十分优秀!