gpt4 book ai didi

r - 即时构建转换语句

转载 作者:行者123 更新时间:2023-12-04 11:18:15 24 4
gpt4 key购买 nike

我有一个包含多个(数字)列的数据框,并且想要创建一个新的数据框,其列是原始数据的等级。

> df <- data.frame(cbind(id=LETTERS[1:10],  
wheat=c(123,234,345,456,678,987,876,654,432,321),barley=c(135,975,246,864,357,753,468,642,579,531)))
> df
id wheat barley
1 A 123 135
2 B 234 975
3 C 345 246
4 D 456 864
5 E 678 357
6 F 987 753
7 G 876 468
8 H 654 642
9 I 432 579
10 J 321 531
> rankeddf <- transform(df, wheat=rank(wheat), barley=rank(barley))
> rankeddf
id wheat barley
1 A 1 1
2 B 2 10
3 C 4 2
4 D 6 9
5 E 8 3
6 F 10 8
7 G 9 4
8 H 7 7
9 I 5 6
10 J 3 5

问题是,列的数量和名称各不相同。我有一个指定它们的向量:

cols <- c("wheat", "barley")

如何即时构造 transform 语句?或者甚至循环遍历 cols 向量,在每次迭代中应用一次 transform 语句?我猜答案可能与 evalevalq 有关,但我还没有完全理解它们。例如,

> rankeddf2 <- df
> for (col in cols) {rankeddf2 <- transform(rankeddf2, evalq(paste(col,"=rank(",col,")",sep="")))}
> rankeddf2
id wheat barley
1 A 123 135
2 B 234 975
3 C 345 246
4 D 456 864
5 E 678 357
6 F 987 753
7 G 876 468
8 H 654 642
9 I 432 579
10 J 321 531

没用。

或者,还有其他方法吗?

最佳答案

您可以通过使用 lapplyrank() 来做到这一点:

as.data.frame(lapply(df[, cols], rank))
wheat barley
1 1 1
2 2 10
3 4 2
4 6 9
5 8 3
6 10 8
7 9 4
8 7 7
9 5 6
10 3 5

好的,所以在这个过程中你会丢失第一列,但很容易添加回来:

data.frame(id=df[[1]], lapply(df[, cols], rank))
id wheat barley
1 A 1 1
2 B 2 10
3 C 4 2
4 D 6 9
5 E 8 3
6 F 10 8
7 G 9 4
8 H 7 7
9 I 5 6
10 J 3 5

关于r - 即时构建转换语句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13000506/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com