gpt4 book ai didi

r - 按行计算超过数据框中值的列数

转载 作者:行者123 更新时间:2023-12-04 00:51:11 25 4
gpt4 key购买 nike

我正在使用 R 中的大数据框,我需要按每一行计算超过保存在数据框中另一个变量中的限制的列数。我的数据框 Base看起来像这样(我在最后一面添加了 dput() 版本):

    ID NT1 NT2 NT3 NT4 NT5 NT6 Limit1 Limit2
1 001 1 1 1 NA NA NA 2 3
2 002 2 1 5 4 NA NA 2 3
3 003 3 NA 1 NA 1 NA 2 3
4 004 3 NA 3 NA 8 NA 2 3
5 005 4 5 1 NA NA NA 4 5
6 006 9 9 9 NA NA 8 8 9
7 007 1 3 5 9 NA NA 5 4
8 008 NA NA 6 7 9 8 6 5
9 009 1 1 NA NA NA NA 1 2
10 010 3 4 5 5 5 5 2 2

我需要计算名称以 NT 开头的列并且超过了名为 Limit1 的列.该值必须保存在另一列中。同样的情况适用于 Limit2我必须计算以 NT 开头的列并超过 Limit2 的值.此外,结果必须保存在新列中。我试过使用下一个代码,但它不起作用:
Base$Count1=apply(Base[c(2:7,8)],1,function(x) length(which(x>Base[8] & !is.na(x))))
此外,还有一个重要的事实, Base是一个包含 200000 行和 60 列的大数据框的示例。为此,我的 apply测试未完成或出现错误。我想得到这样的结果:
    ID NT1 NT2 NT3 NT4 NT5 NT6 Limit1 Limit2 Count1 Count2
1 001 1 1 1 NA NA NA 2 3 0 0
2 002 2 1 5 4 NA NA 2 3 2 2
3 003 3 NA 1 NA 1 NA 2 3 1 0
4 004 3 NA 3 NA 8 NA 2 3 3 1
5 005 4 5 1 NA NA NA 4 5 1 0
6 006 9 9 9 NA NA 8 8 9 3 0
7 007 1 3 5 9 NA NA 5 4 1 2
8 008 NA NA 6 7 9 8 6 5 3 4
9 009 1 1 NA NA NA NA 1 2 0 0
10 010 3 4 5 5 5 5 2 2 6 6

哪里 Count1保存超过 Limit1的列数, 开始于 NT他们不是 NA . Count2也是一样但使用 Limit2 . dput()我的 datafrmae 的版本是下一个:
Base<-structure(list(ID = c("001", "002", "003", "004", "005", "006", 
"007", "008", "009", "010"), NT1 = c(1, 2, 3, 3, 4, 9, 1, NA,
1, 3), NT2 = c(1, 1, NA, NA, 5, 9, 3, NA, 1, 4), NT3 = c(1, 5,
1, 3, 1, 9, 5, 6, NA, 5), NT4 = c(NA, 4, NA, NA, NA, NA, 9, 7,
NA, 5), NT5 = c(NA, NA, 1, 8, NA, NA, NA, 9, NA, 5), NT6 = c(NA,
NA, NA, NA, NA, 8, NA, 8, NA, 5), Limit1 = c(2, 2, 2, 2, 4, 8,
5, 6, 1, 2), Limit2 = c(3, 3, 3, 3, 5, 9, 4, 5, 2, 2)), .Names = c("ID",
"NT1", "NT2", "NT3", "NT4", "NT5", "NT6", "Limit1", "Limit2"), row.names = c(NA,
-10L), class = "data.frame")

非常感谢您的帮助。

最佳答案

我建议像

Base$Count1 <- rowSums(Base[,grep("^NT", names(Base))] > Base$Limit1, na.rm=T)
Base$Count2 <- rowSums(Base[,grep("^NT", names(Base))] > Base$Limit2, na.rm=T)

这产生
    ID NT1 NT2 NT3 NT4 NT5 NT6 Limit1 Limit2 Count1 Count2
1 001 1 1 1 NA NA NA 2 3 0 0
2 002 2 1 5 4 NA NA 2 3 2 2
3 003 3 NA 1 NA 1 NA 2 3 1 0
4 004 3 NA 3 NA 8 NA 2 3 3 1
5 005 4 5 1 NA NA NA 4 5 1 0
6 006 9 9 9 NA NA 8 8 9 3 0
7 007 1 3 5 9 NA NA 5 4 1 2
8 008 NA NA 6 7 9 8 6 5 3 4
9 009 1 1 NA NA NA NA 1 2 0 0
10 010 3 4 5 5 5 5 2 2 6 6

如预期的。

关于r - 按行计算超过数据框中值的列数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28287776/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com