gpt4 book ai didi

r - 有没有办法使用 dplyr 根据除以另一列的 group_by 来创建新列?

转载 作者:行者123 更新时间:2023-12-03 22:04:51 30 4
gpt4 key购买 nike

我正在尝试通过将整数列 A (下面的 data1/2/3)除以列 A 的模式来创建一个新列,当它被另一个整数列 B 分组时(下面的 group1/2)

group1=rep(1:5,each=2)
group2=rep(6:10, each=2)
data1=c(1,1,1,1,1,4,5,6,3,8)
data2=c(5,4,5,7,8,5,2,1,1,5)
data3=c(6,6,8,9,5,4,3,3,1,1)
DF=data.frame(group1,group2,data1,data2,data3)
   group1 group2 data1 data2 data3
1 1 6 1 5 6
2 1 6 1 4 6
3 2 7 1 5 8
4 2 7 1 7 9
5 3 8 1 8 5
6 3 8 4 5 4
7 4 9 5 2 3
8 4 9 6 1 3
9 5 10 3 1 1
10 5 10 8 5 1

我一次成功地完成了这一列(参见下面的代码),但我希望能够概括它:
DF %>%
group_by(group2) %>%
mutate(group2_mode = as.integer(head(names(sort(table(data2))),1))) %>%
mutate(group2_data2 = data2/group2_mode) %>%
#select(-c(group1_mode)) %>%
ungroup()
# A tibble: 10 x 7
group1 group2 data1 data2 data3 group2_mode group2_data2
<int> <int> <dbl> <dbl> <dbl> <int> <dbl>
1 1 6 1 5 6 4 1.25
2 1 6 1 4 6 4 1
3 2 7 1 5 8 5 1
4 2 7 1 7 9 5 1.4
5 3 8 1 8 5 5 1.6
6 3 8 4 5 4 5 1
7 4 9 5 2 3 1 2
8 4 9 6 1 3 1 1
9 5 10 3 1 1 1 1
10 5 10 8 5 1 1 5

这可行,但在为每个数据/组组合写出时很笨重。

我已经尝试遍历 for 循环,如下所示:
for (i in colnames(DF[,3:5])){
for (k in colnames(DF[,1:2])){
DF %>%
group_by(k) %>%
mutate(paste(c(k,"_",i), collapse = '') <- i/as.integer(head(names(sort(table(i))),1)))
}
}

并收到以下错误:
Error: Column `k` is unknown

我希望输出类似于上面的第一个代码块,但对于每个数据/组组合。我还尝试将 for 循环中的所有变异列标记为相同的东西,但这也会导致相同的错误。我怀疑问题出在 group_by 语句中,但我不知道如何。

感谢您的时间

最佳答案

基本解决方案可能同样有用 - 我使用了 mode @Jon Spring 建议的功能。

mode <- function(codes){
which.max(tabulate(codes))
}

groups <- c('group1', 'group2')
datas <- c('data1', 'data2', 'data3')

for (grp in groups) {
for (col in datas) {
DF[, paste(col, grp, sep = '_')] <- ave(x = DF[[col]], DF[[grp]], FUN = function(x) x / mode(x))
}
}

group1 group2 data1 data2 data3 data1_group1 data2_group1 data3_group1 data1_group2 data2_group2 data3_group2
1 1 6 1 5 6 1.000000 1.25 1.000 1.000000 1.25 1.000
2 1 6 1 4 6 1.000000 1.00 1.000 1.000000 1.00 1.000
3 2 7 1 5 8 1.000000 1.00 1.000 1.000000 1.00 1.000
4 2 7 1 7 9 1.000000 1.40 1.125 1.000000 1.40 1.125
5 3 8 1 8 5 1.000000 1.60 1.250 1.000000 1.60 1.250
6 3 8 4 5 4 4.000000 1.00 1.000 4.000000 1.00 1.000
7 4 9 5 2 3 1.000000 2.00 1.000 1.000000 2.00 1.000
8 4 9 6 1 3 1.200000 1.00 1.000 1.200000 1.00 1.000
9 5 10 3 1 1 1.000000 1.00 1.000 1.000000 1.00 1.000
10 5 10 8 5 1 2.666667 5.00 1.000 2.666667 5.00 1.000

关于r - 有没有办法使用 dplyr 根据除以另一列的 group_by 来创建新列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57701238/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com