gpt4 book ai didi

python - Matplotlib 箱线图 : what algorithm is used to calculate range and identify outliers?

转载 作者:太空宇宙 更新时间:2023-11-04 00:32:15 25 4
gpt4 key购买 nike

我目前正在写我的硕士论文。我用自定义编码的 Python 处理了所有数据,我显示数据的主要方法之一是 matplotlib 中的箱线图。我一直在查看文档,但我看不到任何关于它如何对异常值(或“传单”)进行分类并将它们排除在范围之外的信息。

如果我找不到这些信息,这并不是世界末日,但如果我没有在方法论章节中完整描述我的统计工具,我会觉得不完整。

最佳答案

来自matplotlib.pyplot api documentation of boxplot . boxplot 有一个 whis 参数,用于指定 mustache 的范围。默认值为 1.5。

whis : float, sequence, or string (default = 1.5)

As a float, determines the reach of the whiskers to the beyond the first and third quartiles. In other words, where IQR is the interquartile range (Q3-Q1), the upper whisker will extend to last datum less than Q3 + whisIQR). Similarly, the lower whisker will extend to the first datum greater than Q1 - whisIQR. Beyond the whiskers, data are considered outliers and are plotted as individual points. Set this to an unreasonably high value to force the whiskers to show the min and max values. Alternatively, set this to an ascending sequence of percentile (e.g., [5, 95]) to set the whiskers at specific percentiles of the data. Finally, whis can be the string 'range' to force the whiskers to the min and max of the data.

因此, mustache 的默认范围是 1.5* 四分位数范围。实际上,这意味着在使用默认值时,任何低于 Q1 - 1.5* 四分位距的值和高于 Q3 + 1.5* 四分位距的任何值都将被视为异常值。

给定一个非默认值,输出将针对该值进行调整。

关于python - Matplotlib 箱线图 : what algorithm is used to calculate range and identify outliers?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45354617/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com