gpt4 book ai didi

r - 如何计算 data.frame 中的所有唯一值

转载 作者:行者123 更新时间:2023-12-04 11:50:57 24 4
gpt4 key购买 nike

我有一个数据框,其中诊断作为变量,患者作为观察值。它有 32 个变量和 5000 个观测值。

请看这个例子。

我的目标是对数据框中的所有诊断进行统计和总结

set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data
class(Data)
mode(Data)

我知道如何使用 plyr 包为一列做这件事

NoDiag1 <- count(Data, "Diag1")

我怎样才能对整个数据框而不是一个变量执行此操作?

如果这不可能,我如何将第 1-7 列加到一列,以便我可以对这个“合并”列使用计数函数?

最佳答案

这是一种不使用 plyr 使用 table 的方法:

## Data[,-1] is the complete data.frame without the "id" column
table(unlist(Data[,-1]))

# A123 B123 C123 D123 E123 F123 G123 H123 I123 J123 K123 L123 M123 N123 O123 P123 Q123 R123
# 5 8 7 2 3 5 4 4 2 1 4 5 4 5 1 4 3 3

关于r - 如何计算 data.frame 中的所有唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18880379/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com