gpt4 book ai didi

r - 在包代码中从其他包的命名空间中查找对象

转载 作者:行者123 更新时间:2023-12-03 17:07:09 26 4
gpt4 key购买 nike

我正在重构一个导入许多其他包的完整 namespace 的包。我相信其中许多依赖项用于单个函数调用使用,使用 importFrom 可以更好地处理,或者是不再使用的孤立依赖项。
包中有足够的代码,手动检查每一行以查找不熟悉的函数调用会很乏味。
如何确定在包中使用导入命名空间中的对象的位置和次数?请注意,这个包不包括单元测试。
这是一个可重现的示例:DESCRIPTION文件:

Package: my_package
Title: title
Version: 0.0.1
Authors@R: person(
given = "A",
family = "Person",
role = c("aut", "cre"),
email = "person@company.com"
)
Description: Something
License: Some license
Encoding: UTF-8
LazyData: true
RoxygenNote: 7.1.1
Imports:
dplyr,
purrr,
stringr
NAMESPACE文件:
import(dplyr)
import(purrr)
import(stringr)
my_package.R文件:
#' my_package
#' @docType package
#' @name my_package
NULL
#' @import dplyr
#' @import purrr
#' @import stringr
NULL
functions.R文件
#' add 1 to "banana" column and call it "apple"
#' @description demonstrate a variety of dplyr functions
#' @param x a data.frame object
#' @return a data.frame object with columns "apple" and "banana"
#' @examples
#' my_fruit <- data.frame(banana = c(1,2,3), pear = c(4,5,6))
#' my_function(my_fruit)
#' @export
my_function <- function(x) {
x %>%
mutate(apple = banana + 1) %>%
select(apple, banana)
}
我正在寻找能够识别 %>% 的解决方案, mutateselect是从 dplyr 导出的, %>%是来自 purrr 的导出,并且从附加的命名空间 stringr 中没有使用的导出.对于像 %>% 这样的函数从多个命名空间导出 区分导出来自哪个命名空间对我来说并不那么重要(在示例中, %>% 都是来自 magrittr 依赖项的重新导出),因为在实际屏蔽发生的位置会在加载包时生成警告.

最佳答案

这是一个基本解决方案

pkgs <- readLines("NAMESPACE")
pattern <- "^import\\((.*?)\\)$"
pkgs <- pkgs[grepl(pattern, pkgs)]
pkgs <- sub(pattern, "\\1", pkgs)
pkgs
#> [1] "dplyr" "purrr" "stringr"

exports <- sapply(pkgs, getNamespaceExports)
exports <- do.call(rbind, Map(data.frame, package = pkgs, fun = exports))
rownames(exports) <- NULL
head(exports)
#> package fun
#> 1 dplyr rows_upsert
#> 2 dplyr src_local
#> 3 dplyr db_analyze
#> 4 dplyr n_groups
#> 5 dplyr distinct
#> 6 dplyr summarise_

code <- sapply(list.files("R", full.names = TRUE), parse)
funs <- sapply(code, function(x) setdiff(all.names(x), all.vars(x)))
funs <- funs[lengths(funs) > 0]
funs <- do.call(rbind, Map(data.frame, fun = funs, file = names(funs)))
rownames(funs) <- NULL
funs
#> fun file
#> 1 <- R/functions.R
#> 2 function R/functions.R
#> 3 { R/functions.R
#> 4 %>% R/functions.R
#> 5 mutate R/functions.R
#> 6 + R/functions.R
#> 7 select R/functions.R
最终输出:
merge(exports, funs)
#> fun package file
#> 1 %>% stringr R/functions.R
#> 2 %>% purrr R/functions.R
#> 3 %>% dplyr R/functions.R
#> 4 mutate dplyr R/functions.R
#> 5 select dplyr R/functions.R
它不是 100% 健壮的,例如函数 function(x) {select<-identity; select(x)}将显示 select 取自 {dplyr}。
它还会遗漏 fun() 中未使用的函数。形式,如 lapply(my_list, fun) .
如果我们有 100% 的测试覆盖率,我们无法真正可靠地检测到那些可能让我们到达那里或至少更接近的方法,就是将这些导入的函数库化,以便它们在调用时告诉我们,然后运行测试.
你可能不需要这个。

关于r - 在包代码中从其他包的命名空间中查找对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67492020/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com