gpt4 book ai didi

r - 使用 R 中 readr 中的 read_csv 将文本作为指定列以 [type] 打开

转载 作者:行者123 更新时间:2023-12-04 13:08:17 26 4
gpt4 key购买 nike

我有一些要打开的 .csv 文件,将默认列类型指定为“i”(表示整数)。但是,某些文件也有特定的列,我想告诉 readr::read_csv 以定义的类型打开(哪些列的逻辑无关紧要,假设我知道哪些列用于哪些文件)

有没有一种方法可以将这些列传递到 read_csvcol_types 参数中,同时仍然保持每隔一列应该以整数类型打开

df <- data.frame(
a = c(1,2,3,4),
b = sample(1:100, 4),
c_text = c("hi", "I", "am", "text"),
d_decimals = runif(4),
e_more_text = c("another", "text", "column", "lol")
)

readr::write_csv(df, "/path/to/csv/file.csv")

character_cols <- c("c_text", "e_more_text")
double_cols <- "d_decimals"

data <- readr::read_csv(
"/path/to/csv/file.csv",
# supply something here to determine column types
col_types = cols(.default = "i", character_cols = "c", double_cols = "d")
)

因为计算哪些列应该是字符或 double 等的逻辑。我最好将它们作为名称向量提供

干杯

最佳答案

您可以创建一个辅助函数,将您的额外规范与默认列规范相结合,然后使用 do.call 将规范拉到一起。

extra_spec = list(
"c_text" = "c",
"d_decimals" = "i",
"e_more_text" = "c"
)

read_csv_with_default_int = function(path, extra_spec) {
readr::read_csv(path, col_types = do.call(cols, c(extra_spec, list(.default = col_integer()))))
}

read_csv_with_default_int("file.csv", extra_spec = extra_spec)

你也可以用像这样的助手来避免大量的嵌套逻辑

cols_default_int = purrr::partial(cols, .default = col_integer())

read_csv_with_default_int = function(path, col_types) {
readr::read_csv(path, col_types = do.call(cols_default_int, col_types))
}

read_csv_with_default_int("file.csv", col_types = extra_spec)

关于r - 使用 R 中 readr 中的 read_csv 将文本作为指定列以 [type] 打开,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68366051/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com