gpt4 book ai didi

r - 如何捕获对 dplyr::select 中的 data.frame 所做的更改?

转载 作者:行者123 更新时间:2023-12-04 10:44:45 29 4
gpt4 key购买 nike

我想创建一个 data.frame 的子类它带有一些有关特定列状态的信息。我认为最好的方法是使用一个属性,special_col .一个简单的构造函数似乎工作正常:

# Light class that keeps an attribute about a particular special column
new_my_class <- function(x, special_col) {
stopifnot(inherits(x, "data.frame"))
attr(x, "special_col") <- special_col
class(x) <- c("my_class", class(x))
x
}

my_mtcars <- new_my_class(mtcars, "mpg")
class(my_mtcars) # subclass of data.frame
#> [1] "my_class" "data.frame"
attributes(my_mtcars)$special_col # special_col attribute is still there
#> $special_col
#> [1] "mpg"

但是,我遇到了一个问题,如果列名发生更改,我需要为各种泛型编写方法来更新此属性。如下图,使用 data.frame方法将保持属性不变。

library(dplyr)
# Using select to rename a column does not update the attribute
select(my_mtcars, x = mpg) %>%
attr("special_col")
#> [1] "mpg"

这是我目前对 my_class 方法的幼稚尝试.我开始捕获点,然后解析它们以找出哪些列被重命名,如果它们实际上被重命名,则更改属性。

# I attempt to capture the dots supplied to select and replace the attribute
select.my_class <- function(.data, ...) {
exprs <- enquos(...)
sel <- NextMethod("select", .data)
replace_renamed_cols(sel, "special_col", exprs)
}
# This is slightly more complex than needed here in case there is more than one special_col
replace_renamed_cols <- function(x, which, exprs) {
att <- attr(x, which)
renamed <- nzchar(names(exprs)) # Bool: was column renamed?
old_names <- purrr::map_chr(exprs, rlang::as_name)[renamed]
new_names <- names(exprs)[renamed]
att_rn_idx <- match(att, old_names) # Which attribute columns were renamed?
att[att_rn_idx] <- new_names[att_rn_idx]
attr(x, which) <- att
x
}
# This solves the immmediate problem:
select(my_mtcars, x = mpg) %>%
attr("special_col")
#> [1] "x"

不幸的是,我认为这特别脆弱并且在其他情况下会失败,如下所示。

# However, this fails with other expressions:
select(my_mtcars, -cyl)
#> Error: Can't convert a call to a string
select(my_mtcars, starts_with("c"))
#> Error: Can't convert a call to a string

我的感觉是最好在 tidyselect 之后获取列中的更改已经完成了它的工作,而不是像我所做的那样尝试通过捕获点在属性中产生相同的变化。关键问题是: 我如何使用 tidyselect用于了解选择变量时数据框将发生哪些变化的工具? .理想情况下,我可以返回一些内容来跟踪哪些列被重命名为哪些列,哪些列被删除等,并使用它来保持属性 special_col最新。

最佳答案

我认为这样做的方法是在 [ 中对您的属性更新进行编码。和 names<-方法,那么默认的 select 方法应该使用这些泛型。在 dplyr 的下一个主要版本中应该就是这种情况。

https://github.com/r-lib/tidyselect/blob/8d1c76dae81eb55032bcbd83d2d19625db887025/R/eval-select.R#L152-L156预览 select.default 的样子。我们甚至可以从 dplyr 中删除 tbl-df 和 data.frame 方法。最后一行很有趣,它调用了 [names<-方法。

关于r - 如何捕获对 dplyr::select 中的 data.frame 所做的更改?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59060296/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com