gpt4 book ai didi

r - 计算数据集每列的比例(百分比)

转载 作者:行者123 更新时间:2023-12-02 09:05:32 26 4
gpt4 key购买 nike

我正在尝试计算数据集每列中类别的比例(百分比)。

示例数据:

df <- data.frame(
"Size" = c("Y","N","N","Y","Y"),
"Type" = c("N","N","N","Y","N"),
"Age" = c("N","Y","N","Y","N"),
"Sex"=c("N","N","N","N","N")
)

df

数据生成如下表格:

    Size Type Age Sex
1 Y N N N
2 N N Y N
3 N N N N
4 Y Y Y N
5 Y N N N

我尝试使用 prop.table 来计算一个类别的比例:

prop.table(table(df$Size))

这可行,但仅计算一列中 Y 或 N 答案的百分比。这个数据集非常大,所以我想一次计算每个类别的比例。

我的目标是建立一个表格,显示每列"is"答案的比例。

像这样:

       Proportion Y
Size 0.60
Type 0.20
Age 0.40
Sex 0.00

我对 R 比较陌生,因此我们将不胜感激!

最佳答案

基础 R 中的一种方法是在逻辑向量上按列使用 apply

apply(df == "Y", 2, mean)

#Size Type Age Sex
# 0.6 0.2 0.4 0.0

使用 colSums 的更简单版本。

colMeans(df == "Y")

关于r - 计算数据集每列的比例(百分比),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58878122/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com