gpt4 book ai didi

r - guess_formats + R + lubridate

转载 作者:行者123 更新时间:2023-12-04 10:06:56 24 4
gpt4 key购买 nike

我无法理解如何在 lubridate 中使用guess_formats 函数。我有一些未知格式集/顺序的日期向量。我想将它们转换为 Date 对象(或至少尽可能多地转换)。以下代码是我尝试过的:

library(lubridate)
sampleDates <- c("4/6/2004","4/6/2004","4/6/2004","4/7/2004",
"4/6/2004","4/7/2004","2014-06-28","2014-06-30","2014-07-12",
"2014-07-29","2014-07-29","2014-08-12")
formats <- guess_formats(sampleDates, c("Ymd", "mdY"))
dates <- as.Date(sampleDates, format=formats)

这给出了所有 NA。

这显然只是一个简短的例子。在实际情况下,我不知道各种格式分散在哪里,也不能 100% 确定只有 %m/%d/%Y 和 %Y-%m-%d。有人可以让我知道 A. 在这个例子中将如何使用guess_formats 或 B. 是否有更适合在 lubridate/base R 中使用的东西,希望没有很多正则表达式。谢谢!

编辑:
我也试过 parse_date_time。我不明白这个例子的以下工作:
parse_date_time(sampleDates,
orders = c("Ymd", "mdY"),
locale = "eng")

但这不会:
parse_date_time(sampleDates,
orders = c("mdY", "Ydm"),
locale = "eng")

在我的实际数据集中,我不会知道格式化的顺序,这似乎对这个功能很重要。

双重编辑:Dur,好的,我看到我在第一个 parse_date_time 示例中有 Ymd,在第二个示例中有 Ydm……继续。

最佳答案

无需调用guess_formats只需使用 parse_date_time :

 parse_date_time(sampleDates, c("Ymd", "mdY"))

[1] "2004-04-06 UTC" "2004-04-06 UTC" "2004-04-06 UTC" "2004-04-07 UTC" "2004-04-06 UTC"
[6] "2004-04-07 UTC" "2014-06-28 UTC" "2014-06-30 UTC" "2014-07-12 UTC" "2014-07-29 UTC"
[11] "2014-07-29 UTC" "2014-08-12 UTC"

在内部它将调用 guess_formats .

关于r - guess_formats + R + lubridate,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26064292/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com