gpt4 book ai didi

r - 总结所有列

转载 作者:行者123 更新时间:2023-12-03 03:25:11 24 4
gpt4 key购买 nike

我有以下格式的数据:

gen = function () sample.int(10, replace = TRUE)
x = data.frame(A = gen(), C = gen(), G = gen(), T = gen())

我现在想将行中所有元素的总和附加到每一行(我的实际函数更复杂,但 sum 说明了问题)。

如果没有 dplyr,我会写

cbind(x, Sum = apply(x, 1, sum))

结果:

   A C  G T Sum
1 3 1 6 9 19
2 3 4 3 3 13
3 3 1 10 5 19
4 7 2 1 6 16

但是用 dplyr 来做到这一点似乎出人意料地困难。

我已经尝试过

x %>% rowwise() %>% mutate(Sum = sum(A : T))

但结果并不是每行列的总和,这是意想不到的并且(对我来说)令人费解的。

我也尝试过

x %>% rowwise() %>% mutate(Sum = sum(.))

但在这里,. 只是整个 x 的占位符。不出所料,提供no参数也不起作用(结果都是0)。不用说,如果没有 rowwise(),这些变体都无法工作。

(实际上没有任何理由必须在 dplyr 中执行此操作,但是(a)我希望尽可能保持代码统一,并且在不同的 API 之间跳转并没有帮助;(b)我我希望有一天能够在 dplyr 中自动且免费地并行化此类命令。)

最佳答案

我曾经做过类似的事情,当时我的结果是:

x %>%
rowwise() %>%
do(data.frame(., res = sum(unlist(.))))
# A C G T res
# 1 3 2 8 6 19
# 2 6 1 7 10 24
# 3 4 8 6 7 25
# 4 6 4 7 8 25
# 5 6 10 7 2 25
# 6 7 1 2 2 12
# 7 5 4 8 5 22
# 8 9 2 3 2 16
# 9 3 4 7 6 20
# 10 7 5 3 9 24
<小时/>

也许您的更复杂的函数无需 unlist 即可正常工作,但似乎对于 sum 来说这是必要的。因为 . 指的是“当前组”,所以我最初认为 . 例如rowwise 机制中的第一行对应于 x[1, ],它是一个列表,sum 之外愉快地吞下它做

is.list((x[1, ]))
# [1] TRUE

sum(x[1, ])
# [1] 19

但是,如果 do 中没有 unlist ,则会生成错误,我不确定为什么:

x %>%
rowwise() %>%
do(data.frame(., res = sum(.)))
# Error in sum(.) : invalid 'type' (list) of argument

关于r - 总结所有列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28095526/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com