- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我开始涉足 dplyr 编程的美妙世界。我正在尝试编写一个接受 data.frame、目标列和任意数量的分组列(对所有列使用裸名称)的函数。然后该函数将根据目标列对数据进行分箱,并计算每个分箱中的条目数。我想为原始 data.frame() 中存在的分组变量的每个组合保留一个单独的 bin 大小,因此我使用 complete() 和 nesting() 函数来执行此操作。这是我正在尝试做的事情以及我遇到的错误的示例:
library(dplyr)
library(tidyr)
#Prepare test data
set.seed(42)
test_data =
data.frame(Gene_ID = rep(paste0("Gene.", 1:10), times=4),
Comparison = rep(c("WT_vs_Mut1", "WT_vs_Mut2"), each=10, times=2),
Test_method = rep(c("T-test", "MannWhitney"), each=20),
P_value = runif(40))
#Perform operation manually
test_data %>%
#Start by binning the data according to q-value
mutate(Probability.bin = cut(P_value,
breaks = c(-Inf, seq(0.1, 1, by=0.1), Inf),
labels = c(seq(0.0, 1.0, by=0.1)),
right = FALSE)) %>%
#Now summarize the results by bin.
count(Comparison, Test_method, Probability.bin) %>%
#Fill in any missing bins with 0 counts
complete(nesting(Comparison, Test_method), Probability.bin,
fill=list(n = 0))
#Create function that accepts bare column names
bin_by_p_value <- function(df,
pvalue_col, #Bare name of p-value column
...) { #Bare names of grouping columns
#"Quote" column names so they are ready for use below
pvalue_col_name <- enquo(pvalue_col)
group_by_cols <- quos(...)
#Perform the operation
df %>%
#Start by binning the data according to q-value
mutate(Probability.bin = cut(UQ(pvalue_col_name),
breaks = c(-Inf, seq(0.1, 1, by=0.1), Inf),
labels = c(seq(0.0, 1.0, by=0.1)),
right = FALSE)) %>%
#Now summarize the results by bin.
count(UQS(group_by_cols), Probability.bin) %>%
#Fill in any missing bins with 0 counts
complete(nesting(UQS(group_by_cols)), Probability.bin,
# complete(nesting(UQS(group_by_cols)), Probability.bin,
fill=list(n = 0))
}
#Use function to perform operation
test_data %>%
bin_by_p_value(P_value, Comparison, Test_method)
当我手动执行操作时,一切正常。当我使用该函数时,它因以下错误而失败:
Error in overscope_eval_next(overscope, expr) : object 'Comparison' not found
我已将问题缩小到函数中的以下代码:
complete(nesting(UQS(group_by_cols)), Probability.bin...
如果我删除对 nesting() 的调用,代码将在没有错误的情况下执行。但是,我想保留仅使用原始数据中存在的分组变量组合的功能,然后获取所有可能的 bin 组合,以便我可以填充所有缺失的 bin。根据错误名称和失败的地方,我猜这是一个范围/环境问题,我真的应该为 nesting() 中的分组变量使用不同的环境,因为它包含在对 complete() 的调用中。但是,我对 dplyr 编程还很陌生,所以我不确定该怎么做。
我试图通过将分组列合并为一个列,然后使用该联合列作为 complete() 的输入来解决这个问题。这让我可以按照我想要的方式执行 complete() 操作,同时避免使用 nesting() 函数。但是,当我想分离回原始分组列时遇到了麻烦,因为我不知道如何将 quosures 列表转换为字符向量(separate() 的“into”参数需要)。以下是说明我在说什么的代码片段:
#Fill in any missing bins with 0 counts
unite(Merged_grouping_cols, UQS(group_by_cols), sep="*") %>%
complete(Merged_grouping_cols, Probability.bin,
fill=list(n = 0)) %>%
separate(Merged_grouping_cols, into=c("What goes here?"), sep="\\*")
这是相关的版本信息:R 版本 3.4.2 (2017-09-28),tidyr_0.7.2,dplyr_0.7.4
如果有任何变通办法,我将不胜感激,但我想知道我正在做的事情以错误的方式摩擦了 complete() 和 nesting()。
最佳答案
pvalue_col
使用 curl {{}}
。...
) 直接传递给 count
。嵌套
中使用ensyms
和!!!
。bin_by_p_value <- function(df,
pvalue_col, #Bare name of p-value column
...) { #Bare names of grouping columns
#Perform the operation
df %>%
#Start by binning the data according to q-value
mutate(Probability.bin = cut({{pvalue_col}},
breaks = c(-Inf, seq(0.1, 1, by=0.1), Inf),
labels = c(seq(0.0, 1.0, by=0.1)),
right = FALSE)) %>%
#Now summarize the results by bin.
count(..., Probability.bin) %>%
#Fill in any missing bins with 0 counts
complete(nesting(!!!ensyms(...)), Probability.bin, fill=list(n = 0))
}
test_data %>% bin_by_p_value(P_value, Comparison, Test_method)
# A tibble: 44 x 4
# Comparison Test_method Probability.bin n
# <chr> <chr> <fct> <dbl>
# 1 WT_vs_Mut1 MannWhitney 0 1
# 2 WT_vs_Mut1 MannWhitney 0.1 1
# 3 WT_vs_Mut1 MannWhitney 0.2 0
# 4 WT_vs_Mut1 MannWhitney 0.3 1
# 5 WT_vs_Mut1 MannWhitney 0.4 1
# 6 WT_vs_Mut1 MannWhitney 0.5 1
# 7 WT_vs_Mut1 MannWhitney 0.6 0
# 8 WT_vs_Mut1 MannWhitney 0.7 0
# 9 WT_vs_Mut1 MannWhitney 0.8 1
#10 WT_vs_Mut1 MannWhitney 0.9 4
# … with 34 more rows
测试手动调用的输出是否存储在res
中。
identical(res, test_data %>% bin_by_p_value(P_value, Comparison, Test_method))
#[1] TRUE
关于r - dplyr 编程 : unquote-splicing causes overscope error with complete() and nesting(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47211743/
我正在尝试打印 timeval 类型的值。实际上我可以打印它,但我收到以下警告: 该行有多个标记 格式“%ld”需要“long int”类型,但参数 2 的类型为“struct timeval” 程序
我正在编写自己的 unix 终端,但在执行命令时遇到问题: 首先,我获取用户输入并将其存储到缓冲区中,然后我将单词分开并将它们存储到我的 argv[] 数组中。IE命令是“firefox”以启动存储在
我是 CUDA 的新手。我有一个关于一个简单程序的问题,希望有人能注意到我的错误。 __global__ void ADD(float* A, float* B, float* C) { con
我有一个关于 C 语言 CGI 编程的一般性问题。 我使用嵌入式 Web 服务器来处理 Web 界面。为此,我在服务器中存储了一个 HTML 文件。在此 HTML 文件中包含 JavaScript 和
**摘要:**在代码的世界中,是存在很多艺术般的写法,这可能也是部分程序员追求编程这项事业的内在动力。 本文分享自华为云社区《【云驻共创】用4种代码中的艺术试图唤回你对编程的兴趣》,作者: break
我有一个函数,它的任务是在父对象中创建一个变量。我想要的是让函数在调用它的级别创建变量。 createVariable testFunc() [1] "test" > testFunc2() [1]
以下代码用于将多个连续的空格替换为1个空格。虽然我设法做到了,但我对花括号的使用感到困惑。 这个实际上运行良好: #include #include int main() { int ch, la
我正在尝试将文件写入磁盘,然后自动重新编译。不幸的是,某事似乎不起作用,我收到一条我还不明白的错误消息(我是 C 初学者 :-)。如果我手动编译生成的 hello.c,一切正常吗?! #include
如何将指针值传递给结构数组; 例如,在 txt 上我有这个: John Doe;xxxx@hotmail.com;214425532; 我的代码: typedef struct Person{
我尝试编写一些代码来检索 objectID,结果是 2B-06-01-04-01-82-31-01-03-01-01 . 这个值不正确吗? // Send a SysObjectId SNMP req
您好,提前感谢您的帮助, (请注意评论部分以获得更多见解:即,以下示例中的成本列已添加到此问题中;西蒙提供了一个很好的答案,但成本列本身并未出现在他的数据响应中,尽管他提供的功能与成本列一起使用) 我
我想知道是否有人能够提出一些解决非线性优化问题的软件包的方法,而非线性优化问题可以为优化解决方案提供整数变量?问题是使具有相等约束的函数最小化,该函数受某些上下边界约束的约束。 我已经在R中使用了'n
我是 R 编程的初学者,正在尝试向具有 50 列的矩阵添加一个额外的列。这个新列将是该行中前 10 个值的平均值。 randomMatrix <- generateMatrix(1,5000,100,
我在《K&R II C 编程 ANSI C》一书中读到,“>>”和“0; nwords--) sum += *buf++; sum = (sum >>
当下拉列表的选择发生变化时,我想: 1) 通过 div 在整个网站上显示一些 GUI 阻止覆盖 2)然后处理一些代码 3) 然后隐藏叠加层。 问题是,当我在事件监听器函数中编写此逻辑时,将执行 onC
我正在使用 Clojure 和 RESTEasy 设计 JAX-RS REST 服务器. 据我了解,用 Lisp 系列语言编写的应用程序比用“传统”命令式语言编写的应用程序更多地构建为“特定于领域的语
我目前正在研究一种替代出勤监控系统作为一项举措。目前,我设计的用户表单如下所示: Time Stamp Userform 它的工作原理如下: 员工将选择他/她将使用的时间戳类型:开始时间、超时、第一次
我是一名学生,试图自学编程,从在线资源和像您这样的人那里获得帮助。我在网上找到了一个练习来创建一个小程序来执行此操作: 编写一个程序,读取数字 a 和 b(长整型)并列出 a 和 b 之间有多少个数字
我正在尝试编写一个 shell 程序,给定一个参数,打印程序的名称和参数中的每个奇数词(即,不是偶数词)。但是,我没有得到预期的结果。在跟踪我的程序时,我注意到,尽管奇数词(例如,第 5 个词,5 %
只是想知道是否有任何 Java API 可以让您控制台式机/笔记本电脑外壳上的 LED? 或者,如果不可能,是否有可能? 最佳答案 如果你说的是前面的 LED 指示电源状态和 HDD 繁忙状态,恐怕没
我是一名优秀的程序员,十分优秀!