- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在编写一个函数包,用于制作人口统计数据表。我有一个函数(缩写如下),我需要在其中获取几列 (...
),并在其中收集
一个数据框。诀窍是我想保持这些列的名称按顺序排列,因为我需要在收集后按该顺序放置一列。在本例中,这些列是 estimate
、moe
、share
、sharemoe
。
library(tidyverse)
library(rlang)
race <- structure(list(region = c("New Haven", "New Haven", "New Haven", "New Haven", "Outer Ring", "Outer Ring", "Outer Ring", "Outer Ring"),
variable = c("white", "black", "asian", "latino", "white", "black", "asian", "latino"),
estimate = c(40164, 42970, 6042, 37231, 164150, 3471, 9565, 8518),
moe = c(1395, 1383, 697, 1688, 1603, 677, 896, 1052),
share = c(0.308, 0.33, 0.046, 0.286, 0.87, 0.018, 0.051, 0.045),
sharemoe = c(0.011, 0.011, 0.005, 0.013, 0.008, 0.004, 0.005, 0.006)),
class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -8L))
race
#> # A tibble: 8 x 6
#> region variable estimate moe share sharemoe
#> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
#> 1 New Haven white 40164 1395 0.308 0.011
#> 2 New Haven black 42970 1383 0.33 0.011
#> 3 New Haven asian 6042 697 0.046 0.005
#> 4 New Haven latino 37231 1688 0.286 0.013
#> 5 Outer Ring white 164150 1603 0.87 0.008
#> 6 Outer Ring black 3471 677 0.018 0.004
#> 7 Outer Ring asian 9565 896 0.051 0.005
#> 8 Outer Ring latino 8518 1052 0.045 0.006
在函数 gather_arrange
中,我通过映射 rlang::exprs(...)< 来获取
并转换为字符。将这些列的名称提取为字符串是一项艰巨的任务,因此这可能是一个需要改进或重写的地方。但这按照我想要的方式工作,使列...
列的名称type
作为一个因素,其级别为estimate
,moe
,share
, sharemoe
按此顺序。
gather_arrange <- function(df, ..., group = variable) {
gather_cols <- rlang::quos(...)
grp_var <- rlang::enquo(group)
gather_names <- purrr::map_chr(rlang::exprs(...), as.character)
df %>%
tidyr::gather(key = type, value = value, !!!gather_cols) %>%
dplyr::mutate(!!rlang::quo_name(grp_var) := !!grp_var %>%
forcats::fct_inorder() %>% forcats::fct_rev()) %>%
dplyr::mutate(type = as.factor(type) %>% forcats::fct_relevel(gather_names)) %>%
arrange(type)
}
race %>% gather_arrange(estimate, moe, share, sharemoe)
#> # A tibble: 32 x 4
#> region variable type value
#> <chr> <fct> <fct> <dbl>
#> 1 New Haven white estimate 40164
#> 2 New Haven black estimate 42970
#> 3 New Haven asian estimate 6042
#> 4 New Haven latino estimate 37231
#> 5 Outer Ring white estimate 164150
#> 6 Outer Ring black estimate 3471
#> 7 Outer Ring asian estimate 9565
#> 8 Outer Ring latino estimate 8518
#> 9 New Haven white moe 1395
#> 10 New Haven black moe 1383
#> # ... with 22 more rows
但我希望还可以使用冒号表示法来选择列,即 estimate:sharemoe
来执行与输入所有这些列名称相同的操作。
race %>% gather_arrange(estimate:sharemoe)
#> Error: Result 1 is not a length 1 atomic vector
此操作失败,因为它无法从 rlang::exprs(...)
中提取列名称。如何使用此表示法获取列名称?提前致谢!
最佳答案
我认为您正在寻找的功能是 tidyselect::vars_select()
,它由 select 和 rename 在内部使用来完成此任务。它返回变量名称的字符向量。例如:
> tidyselect::vars_select(letters, g:j)
g h i j
"g" "h" "i" "j"
这允许您使用对 dplyr::select
有效的所有相同语法。
关于rlang:在 NSE 函数中使用冒号快捷方式从...获取名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50555526/
我正在编写函数来自动化分析大量人口统计数据的工作流程。我可以从 dplyr 函数的常规管道流中获得我需要的东西,但我需要将其抽象为 NSE 函数。我通过 ... 参数为一系列 gather 调用提供列
我正在尝试编写一个函数,该函数接收数据框的名称和一列以使用 dplyr 进行汇总,然后返回汇总的数据框。我已经尝试了一系列来自 lazyeval 包的 interp() 排列,但我花了太多时间试图让它
是否有规范的 base-R 方法来确定函数参数是否是对象名称而不是文字/表达式? 虽然通常不鼓励使用 NSE,但偶尔会有人有一个好主意并想使用它。 data.frame 是我认为“方便”的最简单用例:
我很难弄清楚如何使用 dplyr::left_join 和 NSE 连接两个表。问题是我无法为“by”提供正确的值。我想我现在已经找到了一个解决方案,但感觉我正在以一种更加复杂的方式来做。所以,如果你
我可以 telnet 到某个主机和端口没有问题并发出命令。但是,当我尝试将套接字连接(使用 nmap NSE 和 Lua)编写到相同的主机和端口时,它会失败并显示以下错误消息: |_sockettes
我想从带有动态过滤器的sql服务器中提取一些数据。我通过以下方式使用了出色的R包dplyr: #Create the filter filter_criteria = ~ column1 %in% s
我想用 dplyr用于动态 filter 的新 NSE 符号(版本 >= 0.6)在我的数据上。假设我有以下虚拟数据集: df = data_frame(x = 1:10, y = 10:1, z =
我正在使用 NSEPY API,我想列出包含在 nifty 50 指数中的股票。 我正在获取个股的历史数据,但没有获取 50 只股票(总共 50 只股票)。我想找回它。 import nsepy fr
考虑以下生成汇总表的交互式示例: library(dplyr) tg % group_by(supp, dose) %>% summarise(N = n(), mea
导入请求 x = requests.get(' https://www1.nseindia.com/live_market/dynaContent/live_watch/equities_stock_
我仍在努力思考非标准评估以及它在 dplyr 中的使用方式.当函数参数是变量名时,我无法理解为什么惰性求值很重要,因此原始上下文的环境似乎并不重要。 在下面的代码中,函数 select3()使用惰性求
经过大量的反复试验和咨询以前的答案,例如 How to detect if bare variable or string我想我自己已经完成了大部分我需要做的事情。但是我很想知道在我将“解决方案”投入
我正在编写一个函数包,用于制作人口统计数据表。我有一个函数(缩写如下),我需要在其中获取几列 (...),并在其中收集 一个数据框。诀窍是我想保持这些列的名称按顺序排列,因为我需要在收集后按该顺序放置
此 python 代码在本地计算机上运行,但未在 上运行 digital ocean 亚马逊AWS Google 协作 赫罗库 以及许多其他 VPS。它在不同时间显示不同的错误。 import r
我正在尝试创建一个函数,根据列的位置选择 DF 中的列。我总是需要第一列,然后是 DF 的子集。我需要选择的每个子集都有 1 个对象。 到目前为止,我已经尝试过以下方法: position % s
想法是在函数中修补对 ggplot 的调用。 例子: library(dplyr) library(ggplot2) library(lazyeval) df % select_(~A,nam
我在终端中运行了这个脚本: nmap -p 80 --script http-joomla-brute --script-args 'passdb=/Users/abc/Documents/passw
所以我已经多次找到各种不同的方法来实现这一点,但在过去一年左右的时间里,dplyr 处理非标准评估的方式发生了变化。基本上实现这一目标的一种方法如下: require("dplyr") test %
我如何利用魔术点 (...)/省略号根据任意列进行过滤? df = tibble::tibble(col1 = c('a', 'b', 'c'), col2 = c(1,3,4)) my_func =
在这段代码中,我试图通过 Python 代码获取 NSE 选项链数据。 工具 - Spyder4 python - 3.7 代码没有抛出任何错误,我不知道我做错了什么。 PRINT 1 将我的正确输出
我是一名优秀的程序员,十分优秀!