gpt4 book ai didi

r - 忽略 ggplot2 箱线图中的异常值

转载 作者:行者123 更新时间:2023-12-03 04:34:57 32 4
gpt4 key购买 nike

如何忽略 ggplot2 箱线图中的异常值?我不只是希望它们消失(即 outlier.size=0),但我希望它们被忽略,以便 y 轴缩放以显示第一个/第三个百分位数。我的异常值导致“盒子”缩小得几乎是一条线。有一些技巧可以解决这个问题吗?

编辑这是一个例子:

y = c(.01, .02, .03, .04, .05, .06, .07, .08, .09, .5, -.6)
qplot(1, y, geom="boxplot")

enter image description here

最佳答案

使用geom_boxplot(outlier.shape = NA)不显示异常值和 scale_y_continuous(limits = c(lower, upper))更改轴限制。

一个例子。

n <- 1e4L
dfr <- data.frame(
y = exp(rlnorm(n)), #really right-skewed variable
f = gl(2, n / 2)
)

p <- ggplot(dfr, aes(f, y)) +
geom_boxplot()
p # big outlier causes quartiles to look too slim

p2 <- ggplot(dfr, aes(f, y)) +
geom_boxplot(outlier.shape = NA) +
scale_y_continuous(limits = quantile(dfr$y, c(0.1, 0.9)))
p2 # no outliers plotted, range shifted

实际上,正如 Ramnath 在他的回答中所表明的那样(Andrie 也在评论中表明了这一点),在计算统计数据后裁剪比例更有意义,通过 coord_cartesian .

coord_cartesian(ylim = quantile(dfr$y, c(0.1, 0.9)))

(您可能仍然需要使用 scale_y_continuous 来修复轴中断。)

关于r - 忽略 ggplot2 箱线图中的异常值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5677885/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com