gpt4 book ai didi

r - 统计这个因子中 "0"的个数

转载 作者:行者123 更新时间:2023-12-04 10:56:28 26 4
gpt4 key购买 nike

考虑以下因素

x = factor(c("1|1","1|0","1|1","1|1","0|0","1|1","0|1"))

我想计算这个因素中字符“0”的出现次数。到目前为止我找到的唯一解决方案是
sum(grepl("0",strsplit(paste(sapply(x, as.character), collapse=""), split="")[[1]]))
# [1] 4

对于这样一个简单的过程,这个解决方案似乎非常复杂。有没有“更好”的选择? (由于该过程将在 2000 个元素长的因子上重复大约 100,000 次,因此我可能最终也会关心性能。)

最佳答案

x = factor(c("1|1","1|0","1|1","1|1","0|0","1|1","0|1"))
x
# [1] 1|1 1|0 1|1 1|1 0|0 1|1 0|1
# Levels: 0|0 0|1 1|0 1|1

sum( unlist( lapply( strsplit(as.character(x), "|"), function( x ) length(grep( '0', x ))) ) )
# [1] 4

或者
sum(nchar(gsub("[1 |]", '', x )))
# [1] 4

基于@Rich Scriven 的评论
sum(nchar(gsub("[^0]", '', x )))
# [1] 4

基于@thelatemail 的评论 - 使用 tabulate工作速度比上述解决方案快得多。这是比较。
sum(nchar(gsub("[^0]", "", levels(x) )) * tabulate(x))

时间简介:
x2 <- sample(x,1e7,replace=TRUE)
system.time(sum(nchar(gsub("[^0]", '', x2 ))));
# user system elapsed
# 14.24 0.22 14.65
system.time(sum(nchar(gsub("[^0]", "", levels(x2) )) * tabulate(x2)));
# user system elapsed
# 0.04 0.00 0.04
system.time(sum(str_count(x2, fixed("0"))))
# user system elapsed
# 1.02 0.13 1.25

关于r - 统计这个因子中 "0"的个数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42545250/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com