- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道是否有一种简单的方法可以使用 ddply
实现我在下面描述的内容。我的数据框描述了一个有两个条件的实验。参与者必须在选项 A 和 B 之间做出选择,我们记录了他们做出决定所花的时间,以及他们的回答是否准确。
我使用 ddply
按条件创建平均值。 nAccurate
列总结了每个条件下准确响应的数量。我也想知道他们花了多少时间来决定并在RT
栏中表达出来。但是,我想计算平均响应时间仅当参与者得到正确响应时(即Accuracy==1
)。目前,下面的代码只能计算所有响应(准确的和不准确的)的平均 react 时间。是否有一种简单的方法来修改它以获得仅在准确试验中计算的平均响应时间?
请参阅下面的示例代码,谢谢!
library(plyr)
# Create sample data frame.
Condition = c(rep(1,6), rep(2,6)) #two conditions
Response = c("A","A","A","A","B","A","B","B","B","B","A","A") #whether option "A" or "B" was selected
Accuracy = rep(c(1,1,0),4) #whether the response was accurate or not
RT = c(110,133,121,122,145,166,178,433,300,340,250,674) #response times
df = data.frame(Condition,Response, Accuracy,RT)
head(df)
Condition Response Accuracy RT
1 1 A 1 110
2 1 A 1 133
3 1 A 0 121
4 1 A 1 122
5 1 B 1 145
6 1 A 0 166
# Calculate averages.
avg <- ddply(df, .(Condition), summarise,
N = length(Response),
nAccurate = sum(Accuracy),
RT = mean(RT))
# The problem: response times are calculated over all trials. I would like
# to calculate mean response times *for accurate responses only*.
avg
Condition N nAccurate RT
1 6 4 132.8333
2 6 4 362.5000
最佳答案
使用plyr
,您可以按如下方式进行:
ddply(df,
.(Condition), summarise,
N = length(Response),
nAccurate = sum(Accuracy),
RT = mean(RT[Accuracy==1]))
这给出:
Condition N nAccurate RT
1: 1 6 4 127.50
2: 2 6 4 300.25
如果您使用data.table
,那么这是另一种方式:
library(data.table)
setDT(df)[, .(N = .N,
nAccurate = sum(Accuracy),
RT = mean(RT[Accuracy==1])),
by = Condition]
关于r - 如何使用 ddply 对特定列的数据进行子集化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32612324/
我正在尝试使用 ddply和 summarise一起来自plyr包,但我很难解析不断变化的列名...在我的例子中,我想要一些可以在 X1 中以编程方式解析的东西,而不是在 X1 中硬编码到 ddply
如何设置汇总数据的列名 library(plyr) ddply(data,.(col1,col2),nrow) 像 ddply(data,.(col1,col2),function(x) data.f
我在使用 plyr 包中的 ddply 函数时遇到了一些问题。我试图用每个组内的计数和比例来总结以下数据。这是我的数据: structure(list(X5employf = structur
我正在使用 ddply马上。处理数字非常容易。如取子组的均值或标准差。 但是我很难处理字符串。我想组合每个子组中同一列中的字符串,但我无法做到。我试过 cbind paste等任何人都可以提供一些帮助
我正在尝试在其中使用 ddply 来创建一个函数。但是我无法上类。这是一个复制我得到的虚拟示例。这有什么关系this bug ? library(ggplot2) data(diamonds) foo
我创建了一个大量使用 dplyr 的包,与此同时,这个包需要包含一个不同的函数,它依赖于 plyr 中的 ddply > 包裹。本来我是直接用@import plyr的,结果命名冲突,把我的其他功能都
我有一个包含客户 ID 和列表的数据框。 我想合并那些属于同一客户的列表。 library(plyr) subsets transactions customerid subset 1
我将如何使用 plyr 复制此内容? with(mtcars, tapply(mpg, cyl, summary)) 以同样的优雅,即不详细说明个人统计数据? 最佳答案 library(plyr) d
有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别: 一个数据框: mydat d a b c 1 1 5 1 2 2 6 1 3 3 7 2 4 4 8 2 通过使用函数 print
我正在使用 ddply 拆分数据帧并将 block 发送到函数。在 ddply 行之前,我设置了 i=1。然后在函数内部递增 i 以便每个数据 block 都获得一个新数字。但是,当我运行它时,每次调
我怎样才能做这个计算: library(ddply) quantile(baseball$ab) 0% 25% 50% 75% 100% 0 25 131 435 705 按组
我希望能够将列名发送给我正在调用的电话 ddply .一个例子ddply称呼: ddply(myData, .(MyGrouping), summarise, count=sum(myColumnNa
我一直试图通过尝试不同的变量和函数并查看结果来了解 plyr 是什么以及如何工作。所以我更多的是在寻找 plyr 如何工作的解释,而不是具体的修复它的答案。我已经阅读了文档,但我的新手大脑仍然没有得到
我试图在数据集的子集中获取汇总统计信息,并自然地转向 plyr 包,因为我正在使用数据帧 ddply()。我不明白为什么这不起作用...... t <- as.data.frame(cbind(1,
这是我的真实数据集的一个简单数据框: df <- data.frame(ID=rep(101:102,each=9),phase=rep(1:3,6),variable=rep(LETTERS[1:3
是否可以使用ddply来汇总数据而不按组分层?我尝试过类似的事情 ddply(df, summarize, a = sum(a, na.rm=T), b = sum(b, na.rm=T)) 最佳答案
由于某种原因,自升级到 R-2.13.0 和升级到 plyr_1.5.1.tar.gz 以来,我得到的结果比我预期的要多...我在旧版本的 plyr(版本不幸的是不确定,因为我刚刚覆盖了它......
我已经ddply 沿着这些线路构建了一个data.frame: out 10)) 这很好用,所以我试着把它放到一个函数中 func val.in)) } func(10) 这不起作用 - 看起来
我试图在我的数据集的子集中获取汇总统计信息,自然而然地转向了 plyr 包,因为我正在使用数据框 ddply()。我不明白为什么这不起作用.... t <- as.data.frame(cbind(1
我有一个返回多个值的函数。我需要在 ddply 中使用它,但我想避免多次调用该函数。这是一个模型示例: library(plyr) ff = function(i) { return(c(min(
我是一名优秀的程序员,十分优秀!