gpt4 book ai didi

r - 在ggplot2中,箱线图线的末尾代表什么?

转载 作者:行者123 更新时间:2023-12-03 07:02:17 25 4
gpt4 key购买 nike

我找不到箱线图线条端点代表什么的描述。

例如,以下是线条结束处上方和下方的点值。 enter image description here

(我意识到盒子的顶部和底部是第 25 个和第 75 个百分点,中心线是第 50 个百分点)。我认为,因为线条上方和下方有一些点,它们并不代表最大/最小值。

最佳答案

箱线图末尾的“点”代表异常值。确定一个点是否为异常值有许多不同的规则,但 R 和 ggplot 使用的方法是“1.5 规则”。如果数据点是:

  • 小于 Q1 - 1.5*IQR
  • 大于 Q3 + 1.5*IQR

那么该点被归类为“异常值”。晶须定义为:

上须线 = min(max(x), Q_3 + 1.5 * IQR)

下须线 = max(min(x), Q_1 – 1.5 * IQR)

其中 IQR = Q_3 – Q_1,盒子长度。因此上须线位于最大 x 值和 Q_3 + 1.5 IQR 中较小的位置,而下须线位于最小 x 值和 Q_1 – 1.5 IQR 中较大的位置。

其他信息

  • 请参阅wikipedia boxplot替代异常值规则页面。
  • 实际上有多种计算分位数的方法。查看`?quantile 了解九种不同方法的描述。

示例

考虑以下示例

> set.seed(1)
> x = rlnorm(20, 1/2)#skewed data
> par(mfrow=c(1,3))
> boxplot(x, range=1.7, main="range=1.7")
> boxplot(x, range=1.5, main="range=1.5")#default
> boxplot(x, range=0, main="range=0")#The same as range="Very big number"

这给出了以下情节: enter image description here

当我们将范围从 1.7 减少到 1.5 时,我们会减少晶须的长度。但是,range=0 是一种特殊情况 - 它相当于“range=infinity”

关于r - 在ggplot2中,箱线图线的末尾代表什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4946964/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com