gpt4 book ai didi

r - 名称和表达式之间的规范 NSE 区分

转载 作者:行者123 更新时间:2023-12-04 03:37:26 27 4
gpt4 key购买 nike

是否有规范的 base-R 方法来确定函数参数是否是对象名称而不是文字/表达式?

虽然通常不鼓励使用 NSE,但偶尔会有人有一个好主意并想使用它。 data.frame 是我认为“方便”的最简单用例:如果您包含已保存的向量,它将使用对象名称作为列名称。 (事实上​​ ,许多类(class)似乎都将此作为制作框架的最佳/唯一方法。)

vec <- 1234:1235
data.frame(vec)
# vec
# 1 1234
# 2 1235

但是输入原始向量,它并没有那么好:

data.frame(1234:1235)
# X1234.1235
# 1 1234
# 2 1235

在 base R 中执行这种形式的 NSE 的常用方法是使用 deparse(substitute(x)),它将返回对象名称("vec") 或作为文字传递的表达式 ("1234:1235")。

存在一些 is.* 函数(例如,is.objectis.expression),尽管它们用于不同的目的。我不想依赖 is.vector 或类似的特定于结构的函数,因为它不会泛化为更复杂的结构化参数(无需大量定制)。

我的想法是try(get(.)) 对象,如果由于某种原因(通常是“未找到”)而失败,则参数很可能是表达式或文字。 (如果未找到 NSE 对象,这将不起作用:library(ggplot2),并且调用环境中不可能有名为 "ggplot2" 的对象。 )

例如,

func <- function(x, ...) {
xname <- deparse(substitute(x))
isobj <- !inherits(try(get(xname), silent = TRUE), "try-error")
if (isobj) "yes" else "no"
}

func(zz)
# [1] "yes"
func(c(zz))
# [1] "no"

(假设 funcisobj 一起做的不仅仅是返回一个字符串。)

用处理省略号的技术扩展该方法,我可以做到:

my_names <- function(...) {
dot_obj_expr <- sapply(eval(substitute(alist(...))), deparse)
nms <- names(dot_obj_expr)
if (is.null(nms)) nms <- rep("", length(dot_obj_expr))
hasgoodnames <- nzchar(nms) |
!sapply(dot_obj_expr, function(obj) inherits(try(get(obj), silent = TRUE), "try-error"))
# rational starting point
goodnames <- sprintf("V%i", seq_along(dot_obj_expr))
# replace those that were already named
goodnames[nzchar(nms)] <- nms[nzchar(nms)]
# replace those that were not named but appear to be an object-name
goodnames[!nzchar(nms) & hasgoodnames] <- dot_obj_expr[!nzchar(nms) & hasgoodnames]
goodnames
}

zz <- 1
my_names(zz, abc = 1:3, 1:3)
# [1] "zz" "abc" "V3"

### less clear when an arg is not found
rm(zz)
my_names(zz, abc = 1:3, 1:3)
# [1] "V1" "abc" "V3"

它提供了(也许)更合理的名称使用约定。

我还没有进行基准测试或分析来了解这是否会产生任何重大的“惩罚”。我相信 try(get(.)) 相当高效,并且由于到目前为止的代码没有改变任何对象,所以我认为不需要内存复制。

(此问题由 advanced-R 告知,http://adv-r.had.co.nz/Computing-on-the-language.html.)

最佳答案

我不确定它是否有帮助,但您似乎只想检查参数是一个符号还是其他东西。你可以这样做

func <- function(x, ...) {
xobj <- substitute(x)
if (is.symbol(xobj)) "yes" else "no"
}
func(zz)
# [1] "yes"
func(c(zz))
# [1] "no"

这将为 zz 返回"is",无论变量 zz 是否实际存在,这可能是也可能不是您想要的。

关于r - 名称和表达式之间的规范 NSE 区分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66643561/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com