gpt4 book ai didi

r - 什么时候使用“with”功能,为什么好呢?

转载 作者:行者123 更新时间:2023-12-03 23:35:08 25 4
gpt4 key购买 nike

使用with()有什么好处?它在帮助文件中提到它在根据数据创建的环境中评估表达式。这有什么好处?与仅在全局环境中进行评估相比,创建环境并在其中进行评估是否更快?还是我还缺少其他东西?

最佳答案

with是没有data参数的函数的包装

有许多函数可用于数据框并带有data参数,因此您不必在每次引用列时都重新输入数据框的名称。 lmplot.formulasubsettransform只是几个示例。

with是通用包装器,可让您像使用数据参数一样使用任何函数。

使用mtcars数据集,可以使用或不使用data参数来拟合模型:

# this is obviously annoying
mod = lm(mtcars$mpg ~ mtcars$cyl + mtcars$disp + mtcars$wt)

# this is nicer
mod = lm(mpg ~ cyl + disp + wt, data = mtcars)


但是,如果(出于某种奇怪的原因)我们想要找到 meancyl + disp + wt,则会出现问题,因为 mean没有像 lm那样的数据参数。这是 with解决的问题:

# without with(), we would be stuck here:
z = mean(mtcars$cyl + mtcars$disp + mtcars$wt)

# using with(), we can clean this up:
z = with(mtcars, mean(cyl + disp + wt))


foo()中包装 with(data, foo(...))可以让我们使用任何具有 foo参数的函数 data-也就是说,我们可以使用未加引号的列名,从而防止重复的 data_name$column_namedata_name[, "column_name"]

何时使用 with

只要您愿意(在R控制台中)和在R脚本中进行交互,都可以使用 with来保存键入内容并使代码更清晰。您需要为单个命令重新输入数据框名称的频率越高(并且您的数据框名称越长!),使用 with的好处就越大。

另请注意, with不限于数据帧。来自 ?with


对于默认的 with方法,它可以是环境,列表,数据帧或如 sys.call中的整数。


我不经常在环境中工作,但是当我这样做时,我发现 with非常方便。

当您只需要一行结果时

正如@Rich Scriven在评论中建议的那样,当您需要使用诸如 with之类的结果时, rle可能非常有用。如果只需要一次结果,则他的示例 with(rle(data), lengths[values > 1])允许您匿名使用 rle(data)结果。

何时避免 with

当有一个 data参数时

许多具有 data参数的函数在调用它时不仅使用更简单的语法来使用它。大多数建模函数(例如 lm)以及许多其他建模函数( ggplot!)也对提供的 data做了大量工作。如果使用 with而不是 data参数,则将限制可用的功能。如果有 data参数,请使用 data参数,而不要使用 with

增添环境

在上面的示例中,结果被分配给全局环境( bar = with(...))。要在列表/环境/数据中进行分配,可以使用 within。 (对于 data.framestransform也很好。)

包装内

不要在R包中使用 withhelp(subset)中有一个警告可能也适用于 with


警告这是旨在交互使用的便利功能。对于编程,最好使用诸如 [之类的标准子集函数,尤其是参数子集的非标准评估会产生意想不到的后果。


如果使用 with构建R包,则在检查它时,可能会收到有关使用无可见绑定的变量的警告或说明。这将使CRAN无法接受该软件包。

with的替代品

不要使用 attach

许多(大多是过时的)R教程都使用 attach来避免使全局环境可以访问列,从而避免重新键入数据框名称。 attach is widely considered to be bad practice and should be avoided。附加的主要危险之一是,如果分别修改数据列,则它们可能会变得不同步。 with避免了这种陷阱,因为它一次被调用一个表达式。关于Stack Overflow的问题很多,新用户遵循旧教程并由于 attach而遇到问题。简单的解决方案是始终不使用 attach

一直使用 with似乎太重复了

如果要执行许多数据操作步骤,您可能会发现自己以 with(my_data, ...开始每一行代码。您可能会认为这种重复几乎和不使用 with一样糟糕。 data.tabledplyr软件包都提供了具有非重复语法的有效数据操作。我鼓励您学习使用其中之一。两者都有出色的文档。

关于r - 什么时候使用“with”功能,为什么好呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42283479/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com