gpt4 book ai didi

r - 如何用 data.table 替换聚合?

转载 作者:行者123 更新时间:2023-12-04 11:34:32 25 4
gpt4 key购买 nike

我有以下数据:

> dput(bla)
structure(list(V1 = structure(c(4L, 4L, 4L, 2L), .Label = c("DDDD",
"EEEE", "NNNN", "PPPP", "ZZZZ"), class = "factor"), V2 = c(100014096L,
100014098L, 100014099L, 100014995L), V3 = c(0.742, 0.779, 0.744,
0.42), V4 = c(1.077, 1.054, 1.049, 0.984), V5 = c(0.662, 0.663,
0.671, 0.487), V6 = c(1.107, 1.14, 1.11, 0.849), V7 = c(0.456,
0.459, 0.459, 1.278)), .Names = c("V1", "V2", "V3", "V4", "V5",
"V6", "V7"), class = "data.frame", row.names = c(NA, 4L))

> bla
V1 V2 V3 V4 V5 V6 V7
1 PPPP 100014096 0.742 1.077 0.662 1.107 0.456
2 PPPP 100014098 0.779 1.054 0.663 1.140 0.459
3 PPPP 100014099 0.744 1.049 0.671 1.110 0.459
4 EEEE 100014995 0.420 0.984 0.487 0.849 1.278

我想执行一个函数来实现以下,目前我正在使用聚合:

> linem<- aggregate(bla[,3:7], list(line=bla$V1),mean, na.rm=T) 
> linem
line V3 V4 V5 V6 V7
1 EEEE 0.420 0.984 0.4870000 0.849 1.278
2 PPPP 0.755 1.060 0.6653333 1.119 0.458

为了提高此脚本的性能,我一直在尝试掌握 data.table 来执行此操作。 如何使用 data.table 获得上述输出?
我一直在尝试使用 data.table 来实现它,但是如果有像 this question 中那样更快的方法,那也会很好。

最佳答案

我们将 'data.frame' 转换为 'data.table' (setDT(bla)),按 'V1' 分组,在 .SDcols 中指定列>,遍历列 (lapply(.SD,) 并获取 mean

 library(data.table)
setDT(bla)[, lapply(.SD, mean), by = V1, .SDcols= 3:ncol(bla)]
# V1 V3 V4 V5 V6 V7
#1: PPPP 0.755 1.060 0.6653333 1.119 0.458
#2: EEEE 0.420 0.984 0.4870000 0.849 1.278

关于r - 如何用 data.table 替换聚合?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33781162/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com