gpt4 book ai didi

r - 忽略 R 中某些值的行求和值

转载 作者:行者123 更新时间:2023-12-05 08:24:52 25 4
gpt4 key购买 nike

我对这个问题进行了跟进:Sum values from rows with conditions in R

这是我的数据:

ID <- c("A", "B", "C", "D", "E", "F")
Q1 <- c(0, 1, 7, 9, NA, 3)
Q2 <- c(0, 3, 2, 2, NA, 3)
Q3 <- c(0, 0, 7, 9, NA, 3)

dta <- data.frame(ID, Q1, Q2, Q3)

我需要对小于 7 的每个值求和,但对于大于 7 的值,我需要对所有小于 7 的数字求和并忽略大于 7 的值。应保留包含所有 NA 的行。结果应如下所示:

ProxySum
0
4
2
2
NA
9

我已经根据上一篇文章的回复尝试了这段代码:

dta2  <- dta %>% 
rowwise() %>%
mutate(ProxySum = ifelse(all(c_across(Q1:Q3) < 7), Reduce(`+`, c_across(Q1:Q3)), (ifelse(any(c_across(Q1:Q3) > 7), sum(.[. < 7]), NA))))

但在数字超过 7 的行中,我最终得到所有行和列的总和。我缺少什么?

最佳答案

base 中的一种方法:

rowSums(dta[, 2:4] * (dta[, 2:4] < 7))

# [1] 0 4 2 2 NA 9

根据@tjebo 评论添加解释

  • dta[, 2:4] < 7您生成了一个填充有 logical 的数据框值,其中 TRUEFALSE对应于 小于大于 7 的值.可以在一行中完成,因为此操作是矢量化的;
  • 然后,您在逻辑 数据框上乘以一个用您的原始值填充的数据框。在引擎盖下,R 转换 logical输入 numeric类型,所以所有 FALSETRUE来自逻辑 数据集的 s 被转换为 0 s 和 1秒。这意味着您将原始值乘以 1如果它们小于 7 ,并通过 0否则;
  • NA < 7生产 NA ,然后乘以 NA将产生 NA同样 - 您保留原始的 NA ;
  • 最后一步是调用 rowSums()在生成的数据帧上,它将总结每个特定行的值。因为他们中的那些超过7变成了0 s,您将它们从结果总和中排除;
  • 以防万一,当您想要获取行的总和时,至少有一个值不是 NA ,你可以使用 na.rm = TRUE你的论点 rowSums()称呼。但是,在这种情况下,对于带有 NA 的行只有你会得到0 .

关于r - 忽略 R 中某些值的行求和值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70354447/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com