gpt4 book ai didi

r - 获取每一行在数据框中出现次数最多的值

转载 作者:行者123 更新时间:2023-12-04 09:38:40 24 4
gpt4 key购买 nike

假设我有一个简单的数据框

test_df <- data.frame(c(0,0,1,0,0,1,1,1,1,1),c(1,0,0,0,0,0,0,0,0,0))

我想获取每行的最大值(0 或 1)。在我的示例中,第一个向量为 1(出现 6 次),第二个向量为 0(出现 9 次)。

我开始于:

> sapply(test_df,table)
c.0..0..1..0..0..1..1..1..1..1. c.1..0..0..0..0..0..0..0..0..0.
0 4 9
1 6 1

到目前为止看起来还不错。然后

> sapply((sapply(test_df,table)),max)
[1] 4 6 9 1

我迷路了,我失去了联想吗? 1 -> 6 , 0 -> 9我想要的是返回一个带有“赢家”的向量:1,0,...

1 for the first vector (6 occurrences)
0 for the second vector (9 occurrences)
...

最佳答案

这可以在一个apply 语句中完成。虽然,不清楚您是否希望每一行或每一列的最大出现次数,所以这里有两个(使用@akrun 的更清晰的数据集),返回一个向量显示每一行/列的“获胜者”(1 或 0)。

## Data
test_df <- data.frame(v1= c(0,0,1,0,0,1,1,1,1,1),
v2= c(1,0,0,0,0,0,0,0,0,0),
v3= c(1,0,0,0,0,0,0,0,0,1))
# v1 v2 v3
# 1 0 1 1
# 2 0 0 0
# 3 1 0 0
# 4 0 0 0
# 5 0 0 0
# 6 1 0 0
# 7 1 0 0
# 8 1 0 0
# 9 1 0 0
# 10 1 0 1

## Solution - For each row
apply(test_df, 1, function(x) { sum(sum(x == 1) > sum(x == 0)) })

## Result
# [1] 1 0 0 0 0 0 0 0 0 1

## Solution - For each column
apply(test_df, 2, function(x) { sum(sum(x == 1) > sum(x == 0)) })

## Result
# v1 v2 v3
# 1 0 0

关于r - 获取每一行在数据框中出现次数最多的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36369565/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com