r - 如何使用 ddply 对特定列的数据进行子集化？-6ren

r - 如何使用 ddply 对特定列的数据进行子集化？

转载作者：行者123 更新时间：2023-12-04 09:37:01

27

4

我想知道是否有一种简单的方法可以使用 ddply 实现我在下面描述的内容。我的数据框描述了一个有两个条件的实验。参与者必须在选项 A 和 B 之间做出选择，我们记录了他们做出决定所花的时间，以及他们的回答是否准确。

我使用 ddply 按条件创建平均值。 nAccurate 列总结了每个条件下准确响应的数量。我也想知道他们花了多少时间来决定并在RT栏中表达出来。但是，我想计算平均响应时间仅当参与者得到正确响应时(即Accuracy==1)。目前，下面的代码只能计算所有响应(准确的和不准确的)的平均 react 时间。是否有一种简单的方法来修改它以获得仅在准确试验中计算的平均响应时间？

请参阅下面的示例代码，谢谢!

library(plyr)

# Create sample data frame. 
Condition = c(rep(1,6), rep(2,6))                               #two conditions
Response  = c("A","A","A","A","B","A","B","B","B","B","A","A")  #whether option "A" or "B" was selected
Accuracy  = rep(c(1,1,0),4)                                     #whether the response was accurate or not
RT        = c(110,133,121,122,145,166,178,433,300,340,250,674)  #response times
df        = data.frame(Condition,Response, Accuracy,RT)

head(df)

  Condition Response Accuracy  RT
1         1        A        1 110
2         1        A        1 133
3         1        A        0 121
4         1        A        1 122
5         1        B        1 145
6         1        A        0 166

# Calculate averages.  
avg <- ddply(df, .(Condition), summarise, 
                 N          = length(Response),
                 nAccurate  = sum(Accuracy),
                 RT         = mean(RT))

# The problem: response times are calculated over all trials. I would like
# to calculate mean response times *for accurate responses only*.

avg
  Condition N nAccurate       RT
          1 6         4 132.8333
          2 6         4 362.5000

最佳答案

使用plyr，您可以按如下方式进行:

ddply(df,
      .(Condition), summarise, 
      N          = length(Response),
      nAccurate  = sum(Accuracy),
      RT         = mean(RT[Accuracy==1]))

这给出:

   Condition N nAccurate     RT
1:         1 6         4 127.50
2:         2 6         4 300.25

如果您使用data.table，那么这是另一种方式:

library(data.table)
setDT(df)[, .(N = .N,
              nAccurate = sum(Accuracy),
              RT = mean(RT[Accuracy==1])),
          by = Condition]

关于r - 如何使用 ddply 对特定列的数据进行子集化？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32612324/

27

4

0

文章推荐： perl - Gitweb:如何像github一样自动以html格式显示markdown文件

文章推荐： r - 拆分向量并求和值

文章推荐： r - 如何从列表中向 R 数据框添加多列

文章推荐： ruby-on-rails - 无法使用 Rails 3 中的 send_file 函数读取文件

r - ddply + 汇总函数列名输入
我正在尝试使用 ddply和 summarise一起来自plyr包，但我很难解析不断变化的列名...在我的例子中，我想要一些可以在 X1 中以编程方式解析的东西，而不是在 X1 中硬编码到 ddply
r - 设置列名 ddply
如何设置汇总数据的列名 library(plyr) ddply(data,.(col1,col2),nrow) 像 ddply(data,.(col1,col2),function(x) data.f
r - ddply 总结比例计数
我在使用 plyr 包中的 ddply 函数时遇到了一些问题。我试图用每个组内的计数和比例来总结以下数据。这是我的数据: structure(list(X5employf = structur
r - ddply 总结字符串操作
我正在使用 ddply马上。处理数字非常容易。如取子组的均值或标准差。但是我很难处理字符串。我想组合每个子组中同一列中的字符串，但我无法做到。我试过 cbind paste等任何人都可以提供一些帮助
r - 在函数内使用 ddply
我正在尝试在其中使用 ddply 来创建一个函数。但是我无法上类。这是一个复制我得到的虚拟示例。这有什么关系this bug ? library(ggplot2) data(diamonds) foo
r - 在包中正确引用 ddply
我创建了一个大量使用 dplyr 的包，与此同时，这个包需要包含一个不同的函数，它依赖于 plyr 中的 ddply > 包裹。本来我是直接用@import plyr的，结果命名冲突，把我的其他功能都
r - 用于创建列表联合的 ddply
我有一个包含客户 ID 和列表的数据框。我想合并那些属于同一客户的列表。 library(plyr) subsets transactions customerid subset 1
ddply(plyr)中的R汇总函数以简单的方式
我将如何使用 plyr 复制此内容? with(mtcars, tapply(mpg, cyl, summary)) 以同样的优雅，即不详细说明个人统计数据？最佳答案 library(plyr) d
r - ddply 和聚合之间的区别
有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别: 一个数据框: mydat d a b c 1 1 5 1 2 2 6 1 3 3 7 2 4 4 8 2 通过使用函数 print
R - ddply 并增加一个计数器
我正在使用 ddply 拆分数据帧并将 block 发送到函数。在 ddply 行之前，我设置了 i=1。然后在函数内部递增 i 以便每个数据 block 都获得一个新数字。但是，当我运行它时，每次调
r - 按组对多个分位数进行 ddply
我怎样才能做这个计算: library(ddply) quantile(baseball$ab) 0% 25% 50% 75% 100% 0 25 131 435 705 按组
r - 从函数发送列名到 ddply
我希望能够将列名发送给我正在调用的电话 ddply .一个例子ddply称呼: ddply(myData, .(MyGrouping), summarise, count=sum(myColumnNa
r - 学习理解plyr、ddply
我一直试图通过尝试不同的变量和函数并查看结果来了解 plyr 是什么以及如何工作。所以我更多的是在寻找 plyr 如何工作的解释，而不是具体的修复它的答案。我已经阅读了文档，但我的新手大脑仍然没有得到
r - ddply() 似乎没有在我的数据框中划分子集
我试图在数据集的子集中获取汇总统计信息，并自然地转向 plyr 包，因为我正在使用数据帧 ddply()。我不明白为什么这不起作用...... t <- as.data.frame(cbind(1,
具有多个变量的 R ddply
这是我的真实数据集的一个简单数据框: df <- data.frame(ID=rep(101:102,each=9),phase=rep(1:3,6),variable=rep(LETTERS[1:3
r - ddply 用于没有组的整个数据？
是否可以使用ddply来汇总数据而不按组分层？我尝试过类似的事情 ddply(df, summarize, a = sum(a, na.rm=T), b = sum(b, na.rm=T)) 最佳答案
r - ddply 返回太多结果
由于某种原因，自升级到 R-2.13.0 和升级到 plyr_1.5.1.tar.gz 以来，我得到的结果比我预期的要多...我在旧版本的 plyr(版本不幸的是不确定，因为我刚刚覆盖了它......
r - 将函数中的值传递给 ddply
我已经ddply 沿着这些线路构建了一个data.frame: out 10)) 这很好用，所以我试着把它放到一个函数中 func val.in)) } func(10) 这不起作用 - 看起来
r - ddply() 似乎没有在我的数据框中进行子集化
我试图在我的数据集的子集中获取汇总统计信息，自然而然地转向了 plyr 包，因为我正在使用数据框 ddply()。我不明白为什么这不起作用.... t <- as.data.frame(cbind(1
r - ddply 多输出函数的使用
我有一个返回多个值的函数。我需要在 ddply 中使用它，但我想避免多次调用该函数。这是一个模型示例: library(plyr) ff = function(i) { return(c(min(

首页

博学

6Ren·AI

商城

r - 如何使用 ddply 对特定列的数据进行子集化？