- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
最新版本的 dplyr 不推荐使用下划线版本的函数,例如 filter_,转而使用 tidy evaluation .
新方式下划线形式的新形式是什么?如何使用 R CMD 检查来避免 undefined symbol ?
library(dplyr)
df <- data_frame(id = rep(c("a","b"), 3), val = 1:6)
df %>% filter_(~id == "a")
# want to avoid this, because it references column id in a variable-style
df %>% filter( id == "a" )
# option A
df %>% filter( UQ(rlang::sym("id")) == "a" )
# option B
df %>% filter( UQ(as.name("id")) == "a" )
# option C
df %>% filter( .data$id == "a" )
是否有首选或更考虑的形式?选项 C 是最短的,但在我的一些现实世界中较大的数据集和更复杂的 dplyr 结构上速度较慢:
microbenchmark(
sym = dsPClosest %>%
group_by(!!sym(dateVarName), !!sym("depth")) %>%
summarise(temperature = mean(!!sym("temperature"), na.rm = TRUE)
, moisture = mean(!!sym("moisture"), na.rm = TRUE)) %>%
ungroup()
,data = dsPClosest %>%
group_by(!!sym(dateVarName), .data$depth ) %>%
summarise(temperature = mean(.data$temperature , na.rm = TRUE)
, moisture = mean(.data$moisture , na.rm = TRUE)) %>%
ungroup()
,times=10
)
#Unit: milliseconds
# expr min lq mean median uq max neval
# sym 80.05512 84.97267 122.7513 94.79805 100.9679 392.1375 10
# data 4652.83104 4741.99165 5371.5448 5039.63307 5471.9261 7926.7648 10
还有一个answer for mutate_使用更复杂的语法。
最佳答案
根据您的评论,我猜应该是:
df %>% filter(!!as.name("id") == "a")
rlang
是不必要的,因为您可以使用 !!
和 as.name
而不是 UQ
来完成此操作和sym
。
但也许更好的选择是范围过滤器,它可以避免与 quosure 相关的问题:
df %>% filter_at(vars("id"), all_vars(. == "a"))
在上面的代码中,vars()
确定我们要对哪些列应用过滤语句(在 filter_at
的帮助中,过滤语句称为“predicate”。在本例中,vars("id")
表示过滤语句仅应用于 id
列。过滤语句可以是 all_vars()
或 any_vars()
语句,尽管它们在本例中是等效的。all_vars(.== "a")
表示所有vars("id")
中的列必须等于 "a"
。是的,这有点令人困惑。
与您的示例类似的数据的计时:在本例中,我们使用 group_by_at
和 summarise_at
,它们是这些函数的作用域版本:
set.seed(2)
df <- data_frame(group = sample(1:100,1e4*52,replace=TRUE),
id = rep(c(letters,LETTERS), 1e4),
val = sample(1:50,1e4*52,replace=TRUE))
microbenchmark(
quosure=df %>% group_by(!!as.name("group"), !!as.name("id")) %>%
summarise(val = mean(!!as.name("val"))),
data=df %>% group_by(.data$group, .data$id) %>%
summarise(val = mean(.data$val)),
scoped_group_by = df %>% group_by_at(vars("group","id")) %>%
summarise_at("val", mean), times=10)
Unit: milliseconds
expr min lq mean median uq max neval cld
quosure 59.29157 61.03928 64.39405 62.60126 67.93810 72.47615 10 a
data 391.22784 394.65636 419.24201 413.74683 425.11709 498.42660 10 b
scoped_group_by 69.57573 71.21068 78.26388 76.67216 82.89914 91.45061 10 a
原始答案
我认为在这种情况下,您可以输入过滤器变量作为裸名称,然后使用 enquo
和 !!
(相当于 UQ
) 使用过滤器变量。例如:
library(dplyr)
fnc = function(data, filter_var, filter_value) {
filter_var=enquo(filter_var)
data %>% filter(!!filter_var == filter_value)
}
fnc(df, id, "a")
id val
1 a 1
2 a 3
3 a 5
fnc(mtcars, carb, 3)
mpg cyl disp hp drat wt qsec vs am gear carb
1 16.4 8 275.8 180 3.07 4.07 17.4 0 0 3 3
2 17.3 8 275.8 180 3.07 3.73 17.6 0 0 3 3
3 15.2 8 275.8 180 3.07 3.78 18.0 0 0 3 3
关于r - dplyr tidyeval 相当于下划线函数版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47664611/
无法使用 Hive 版本 1.1.0 HBase 版本 0.94.8 和 hadoop 版本 2.7.0 从 hive 创建 Hbase 表 hive (default)> CREATE TABLE
我试图为 electron app 创建可执行文件但面临这个问题 Unable to determine Electron version. Please specify an Electron ve
我正在尝试让自适应阈值在 python 绑定(bind)到 opencv 中工作(swig 一个 - 无法让 opencv 2.0 工作,因为我正在使用 beagleboard 因为交叉编译还没有工作
我一直在 linux 机器上使用 JMeter,在命令行下使用了一段时间。工作正常。 今天,我在 Windows 机器(新客户端等)上尝试了它,它确实可以工作,但在控制台窗口中输出有很大不同。 Lin
在我的编码环境中,我通常使用最新版本的 Java 和 Eclipse。当我编写源代码时,我不会注意我使用的 API 方法或类是否向后兼容旧版本的 Java 或 Eclipse。在 javadoc 中存
问题是关于版本的特定组合,但更普遍。 我刚刚从 Kubuntu 12.04 升级到 14.04。现在,当我想编译 CUDA 代码(使用 CUDA 6.5)时,我得到: #error -- unsupp
我目前正在对我的一些应用程序进行沙箱处理,看来我必须删除一些功能才能满足 Mac App Store 沙箱(和其他)规则。 显然用户不会因为失去功能而感到高兴,我担心他们不会指责苹果制定了愚蠢的规则,
我用 flash 和 js 版本创建了一个动画横幅。 是否可以检测低于版本 9 的 ie 版本,然后提供 Flash 横幅,否则提供 js 横幅。 最佳答案 您可以使用条件注释来检测 IE 版本
我有一个处理不同位置的数据库的应用程序,我想检查这些数据库是否使用 Firebird 2.5 或更高版本打开。我们最近从 Firebird 2.0 迁移到了 2.5,我们有很多数据库可以响应 sele
我正在开发一个应用程序,我使用托管在我的服务器上的 Java 和 Jersey 构建了后端部分。我在服务器上使用 Tomcat7 来调用 Web 服务。 我以前有一台安装了 Ubuntu 的计算机,我
我可以使用 GetVersionEx() 函数来获取 Windows 版本,但是这个函数将返回一个数字而不是一个字符串。但是没有问题,因为我可以将数字转换为字符串,例如: if (osvi.dwMaj
我已经在我的系统中安装了 Anaconda 2 & 3。 Anaconda 2 包含 python 2.7 & Anaconda 3 包含 python 3.6。 我需要使用命令提示符运行我的 pyt
我正在尝试构建一个 Android 项目,但发生了以下错误 Error:(10, 1) A problem occurred evaluating project ':app'. > Failed t
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
在降级我的 GCC 之前,我想知道是否有办法确定我的机器中的哪些程序/框架或依赖项会中断,以及是否有更好的方法来执行 openpose 安装? (例如,在 CMake 中更改某些内容) 有没有办法在不
我已经在终端的代码sudo apt-get install Shadowsocks-qt5中安装了Shadowsocks-Qt5,然后我可以通过搜索找到启动图标,但是它当我点击图标时打不开。然后我尝试
在网络上找到的文档说,MLLP V2(第 2 版)是用于传输 HL7 版本 3 内容的所有消息传输协议(protocol)的要求。似乎 MLLP 第 2 版主要用于 HL7 第 3 版。 我们可以/应
我正在使用带有 selinium webdriver 的 Protractor 。我的chromeDriver版本是78.0.1,chrome版本是78.0.3904.97。两个版本都匹配,应该不会有
我正在按照教程设置 mysql 数据库并做一些事情。我无法找到数据库资源管理器。我读了很多,但在 Window->show View-> Dataxxx 或右侧上部选项卡中无法正常工作。 最佳答案 从
我已经在 KDE 桌面上安装了 Anaconda 2.0.1。当我运行 python 并看到所有已安装的模块时,我收到此消息“无法将不兼容的 Qt 库(版本 0x40801)与该库(版本 0x4080
我是一名优秀的程序员,十分优秀!