gpt4 book ai didi

r - 如何使用 purrr 和 tidyr 修改嵌套数据框中的列类型

转载 作者:行者123 更新时间:2023-12-04 01:29:58 24 4
gpt4 key购买 nike

我正在将许多源文件中的数据读取到嵌套数据框中。某些列具有不兼容的数据类型,这会阻止 tidyr::unnest()从工作中发挥作用。

例如这里是一个基于 iris 的嵌套数据框数据集:

irisnested <- iris %>% 
rename_all(tolower) %>%
group_by(species) %>%
nest()

为了重现我的问题,我更改了 data 中的子数据框之一中的列类型。嵌套数据框的列表列:
irisnested$data[[2]]$sepal.length <- as.character(irisnested$data[[2]]$sepal.length)

现在数据框不能再取消嵌套了:
irisnested %>% 
unnest(data)
# Error in bind_rows_(x, .id) : Column `sepal.length` can't be converted from numeric to character

为了更正每个嵌套数据框中的列类型,我使用了一个匿名函数:
irisnested %>% 
mutate(data = map(data,
function(dtf){
dtf$sepal.length = as.numeric(dtf$sepal.length)
return(dtf)
})) %>%
unnest(data)

现在可以再次取消嵌套数据框。但是这个匿名函数看起来很复杂,我的直觉是肯定有另一种方法可以做到这一点。是否有更好的方法来执行此修改,例如使用 modify_at ?

最佳答案

我们可以使用 ~ , 获取数据为 .x ,然后使用 mutate更改感兴趣的列的类型

irisnested %>% 
mutate(data = map(data, ~
.x %>%
mutate(sepal.length = as.numeric(sepal.length))))

关于r - 如何使用 purrr 和 tidyr 修改嵌套数据框中的列类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51898869/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com