R数据表: How to sum variables by group based on a condition?-6ren

R数据表: How to sum variables by group based on a condition?

转载作者：行者123 更新时间：2023-12-01 22:16:13

假设我有以下 R data.table(尽管我也很高兴使用 base R，data.frame)

library(data.table)

dt = data.table(Category=c("First","First","First","Second","Third", "Third", "Second"), Frequency=c(10,15,5,2,14,20,3), times = c(0, 0, 0, 3, 3, 1))

> dt
   Category Frequency times
1:    First        10     0
2:    First        15     0
3:    First         5     0
4:   Second         2     3
5:    Third        14     3
6:    Third        20     1
7:   Second         3     0

如果我想按类别对频率求和，我会使用以下内容:

data[, sum(Frequency), by = Category]

但是，如果且仅当 times 非零且不等于 时，假设我想按 Category 对 Frequency 求和>不适用?

如何根据单独列的值使此总和成为条件？

编辑:为显而易见的问题道歉。快速补充:如果某列的元素是字符串怎么办？

例如

> dt
   Category Frequency times
1:    First        ten    0
2:    First        ten    0
3:    First        five   0
4:   Second        five   3
5:    Third        five   3
6:    Third        five   1
7:   Second        ten    0

Sum() 不会计算 10 与 5

的频率

最佳答案

记住data.table的逻辑:dt[i, j, by]，即取dt，子集行使用i，然后计算按by分组的j。

dt[times != 0 & !is.na(times), sum(Frequency), by = Category]
   Category V1
1:   Second  2
2:    Third 34

关于R数据表: How to sum variables by group based on a condition?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45679883/

文章推荐： php - DateTime 7 天后的 00 :00

文章推荐： C# 使用 Newtonsoft.Json 将 JSON 字符串反序列化为对象

文章推荐： sql - 我们如何在oracle查询中根据月份和年份选择数据

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

R数据表: How to sum variables by group based on a condition?