gpt4 book ai didi

r - 为 read.table/read.csv 中的 colClasses 参数指定自定义日期格式

转载 作者:行者123 更新时间:2023-12-03 04:48:31 25 4
gpt4 key购买 nike

问题:

在 read.table/read.csv 中使用 colClasses 参数时是否可以指定日期格式?

(我意识到我可以在导入后进行转换,但是对于许多这样的日期列,在导入步骤中执行此操作会更容易)

<小时/>

示例:

我有一个 .csv,其日期列的格式为 %d/%m/%Y

dataImport <- read.csv("data.csv", colClasses = c("factor","factor","Date"))

这会导致转换错误。例如,15/07/2008 变为 0015-07-20

<小时/>

可重现的代码:

data <- 
structure(list(func_loc = structure(c(1L, 2L, 3L, 3L, 3L, 3L,
3L, 4L, 4L, 5L), .Label = c("3076WAG0003", "3076WAG0004", "3076WAG0007",
"3076WAG0009", "3076WAG0010"), class = "factor"), order_type = structure(c(3L,
3L, 1L, 1L, 1L, 1L, 2L, 2L, 3L, 1L), .Label = c("PM01", "PM02",
"PM03"), class = "factor"), actual_finish = structure(c(4L, 6L,
1L, 2L, 3L, 7L, 1L, 8L, 1L, 5L), .Label = c("", "11/03/2008",
"14/08/2008", "15/07/2008", "17/03/2008", "19/01/2009", "22/09/2008",
"6/09/2007"), class = "factor")), .Names = c("func_loc", "order_type",
"actual_finish"), row.names = c(NA, 10L), class = "data.frame")


write.csv(data,"data.csv", row.names = F)

dataImport <- read.csv("data.csv")
str(dataImport)
dataImport

dataImport <- read.csv("data.csv", colClasses = c("factor","factor","Date"))
str(dataImport)
dataImport

输出如下:

code output

最佳答案

您可以编写自己的函数,接受字符串并使用您想要的格式将其转换为日期,然后使用 setAs 将其设置为 as 方法。然后您可以将您的函数用作 colClasses 的一部分。

尝试:

setAs("character","myDate", function(from) as.Date(from, format="%d/%m/%Y") )

tmp <- c("1, 15/08/2008", "2, 23/05/2010")
con <- textConnection(tmp)

tmp2 <- read.csv(con, colClasses=c('numeric','myDate'), header=FALSE)
str(tmp2)

然后根据需要进行修改以适应您的数据。

编辑---

您可能需要先运行 setClass('myDate') 以避免警告(您可以忽略警告,但如果您经常这样做,而且这是一个简单的调用,它可能会变得烦人这样就摆脱了它)。

关于r - 为 read.table/read.csv 中的 colClasses 参数指定自定义日期格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13022299/

25 4 0