gpt4 book ai didi

r - 在 R 中按组自定义规范化

转载 作者:行者123 更新时间:2023-12-02 02:45:05 26 4
gpt4 key购买 nike

我有一个看起来像这样的数据框:

group1<-c(rep(1,12))
group2<-c(rep('Low',6), rep('High',6))
var <-c(1:6,1:6)
var1 <-c(2:13)
var2 <-c(20:31)
df1<-data.frame(group1,group2,var,var1,var2)
group1<-c(rep(2,12))
group2<-c(rep('Low',6), rep('High',6))
var <-c(1:6,1:6)
var1 <-c(2:13)
var2 <-c(20:31)
df2<-data.frame(group1,group2,var,var1,var2)

df<-rbind(df1,df2)

group1 group2 var var1 var2
1 1 Low 1 2 20
2 1 Low 2 3 21
3 1 Low 3 4 22
4 1 Low 4 5 23
5 1 Low 5 6 24
6 1 Low 6 7 25
7 1 High 1 8 26
8 1 High 2 9 27
9 1 High 3 10 28
10 1 High 4 11 29
11 1 High 5 12 30
12 1 High 6 13 31
13 2 Low 1 2 20
14 2 Low 2 3 21
15 2 Low 3 4 22
16 2 Low 4 5 23
17 2 Low 5 6 24
18 2 Low 6 7 25
19 2 High 1 8 26
20 2 High 2 9 27
21 2 High 3 10 28
22 2 High 4 11 29
23 2 High 5 12 30
24 2 High 6 13 31

我想通过以下方式规范化我的列。对于 group1group2 的每个组合,我想将 var1var1 列与其第一个元素分开。这使我能够跨感兴趣的列构建一个通用的比例/索引。例如,查看 group1=1group2=low 的组合,var1 的相关元素应转换为 2/2,3/2,4/2,5/2,6/2,7/2 分别用于组合 group1=1group2=High 应该是 8/8,9/8,10/8,11/8,12/8,13/8 等等。

我想对 var1var2 进行上述转换。预期的输出应该是这样的:

   group1 group2 var var1 var2 var1_tra var2_tra
1 1 Low 1 2 20 1.000 1.000000
2 1 Low 2 3 21 1.500 1.050000
3 1 Low 3 4 22 2.000 1.100000
4 1 Low 4 5 23 2.500 1.150000
5 1 Low 5 6 24 3.000 1.200000
6 1 Low 6 7 25 3.500 1.250000
7 1 High 1 8 26 1.000 1.000000
8 1 High 2 9 27 1.125 1.038462
9 1 High 3 10 28 1.250 1.076923
10 1 High 4 11 29 1.375 1.115385
11 1 High 5 12 30 1.500 1.153846
12 1 High 6 13 31 1.625 1.192308
13 2 Low 1 2 20 1.000 1.000000
14 2 Low 2 3 21 1.500 1.050000
15 2 Low 3 4 22 2.000 1.100000
16 2 Low 4 5 23 2.500 1.150000
17 2 Low 5 6 24 3.000 1.200000
18 2 Low 6 7 25 3.500 1.250000
19 2 High 1 8 26 1.000 1.000000
20 2 High 2 9 27 1.125 1.038462
21 2 High 3 10 28 1.250 1.076923
22 2 High 4 11 29 1.375 1.115385
23 2 High 5 12 30 1.500 1.153846
24 2 High 6 13 31 1.625 1.192308

注意:数字可以是任何东西,通常是正实数,并且因为我的数据框非常大,所以无法提前知道我想要除以什么元素以执行此类转换.

最佳答案

按“group1”、“group2”分组后,使用mutate_at 对按该列的first 值选择的列进行划分

library(dplyr)
df %>%
group_by(group1, group2) %>%
mutate_at(vars(var1, var2), list(tra = ~ ./first(.)))
# A tibble: 24 x 7
# Groups: group1, group2 [4]
# group1 group2 var var1 var2 var1_tra var2_tra
# <dbl> <fct> <int> <int> <int> <dbl> <dbl>
# 1 1 Low 1 2 20 1 1
# 2 1 Low 2 3 21 1.5 1.05
# 3 1 Low 3 4 22 2 1.1
# 4 1 Low 4 5 23 2.5 1.15
# 5 1 Low 5 6 24 3 1.2
# 6 1 Low 6 7 25 3.5 1.25
# 7 1 High 1 8 26 1 1
# 8 1 High 2 9 27 1.12 1.04
# 9 1 High 3 10 28 1.25 1.08
#10 1 High 4 11 29 1.38 1.12
# … with 14 more rows

或者使用data.table

nm1 <- c("var1", "var2")
nm2 <- paste0(nm1, "_tra")
library(data.table)
setDT(df)[, (nm2) := lapply(.SD, function(x) x/first(x)),
by = .(group1, group2), .SDcols = nm1]

关于r - 在 R 中按组自定义规范化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55785500/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com