gpt4 book ai didi

r - 如何检查数据是否每组具有相同数量的观察值?

转载 作者:行者123 更新时间:2023-12-04 10:48:56 26 4
gpt4 key购买 nike

我正在编写一些代码,我需要检查给定数据输入的所有组大小是否相等。例如,假设我想知道“mpg”数据集(在 ggplot2 包中)是否具有:

  • 每个制造商的汽车数量相同
  • 每种驱动类型(四轮、前轮、后轮)的汽车数量相同
  • 每种发动机类型(4 缸、6 缸、8 缸)的汽车数量相同

对于像 mpg 这样的数据,其中一些问题可以通过检查摘要输出来回答

library(ggplot2)   # contains the mpg dataset
summary(mpg$drive) # shows the breakdown of cars by drive-type,
# which we can verify is unequal

但我觉得我缺少一种简单的方法来检查组大小是否相等。是否有一些我可以调用的单一的、神话般的函数,比如 are.groups.of.equal.size(x)?或者会返回此类信息的另一个基本函数(或它们的组合)?

最佳答案

这是一种实现方式:

are.groups.of.equal.size <- function(x)length(unique(table(x))) == 1L

are.groups.of.equal.size(mpg$manufacturer)
# [1] FALSE
are.groups.of.equal.size(mpg$drv)
# [1] FALSE
are.groups.of.equal.size(mpg$year)
# [1] TRUE

请注意,如果需要, 有关于如何处理数据中的 NA 的选项。

关于r - 如何检查数据是否每组具有相同数量的观察值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10423269/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com