gpt4 book ai didi

python - Python 中调整后的箱线图

转载 作者:太空宇宙 更新时间:2023-11-03 16:23:57 25 4
gpt4 key购买 nike

对于我的论文,我试图识别数据集中的异常值。该数据集由来自真实过程环境的一个变量的 160000 次构建。然而,在这种环境中,测量结果可能不是来自过程本身的实际数据,而只是垃圾数据。我想在文献的帮助下过滤掉它们,而不仅仅是“专家意见”。

现在我已经了解了 IQR 方法,用于查看在处理正态分布等对称分布时是否存在可能的异常值。然而,我的数据集是右偏的,并且通过分布拟合、逆 Gamma 和对数正态最适合。

因此,在我搜索非对称分布的方法期间,我在交叉验证上发现了这个主题,其中 user603 的答案特别有趣:Is there a boxplot variant for Poisson distributed data?

在 user603 的回答中,他指出调整后的箱线图有助于识别数据集中可能的异常值,并且 R 和 Matlab 具有这方面的功能

(There is an 𝚁R implementation of this (𝚛𝚘𝚋𝚞𝚜𝚝𝚋𝚊𝚜𝚎::𝚊𝚍𝚓𝚋𝚘𝚡()robustbase::adjbox()) as well as a matlab one (in a library called 𝚕𝚒𝚋𝚛𝚊libra)

我想知道Python中是否有这样的函数。或者有没有办法用 python 计算医学对(参见 user603 答案中的论文)?

我真的很想看看我的数据调整后的箱线图会出现什么结果..

最佳答案

在 statsmodels.stats.stattools 模块中,有一个函数 med Couple(),它是调整后箱线图中使用的偏度的度量。

enter link description here

使用此变量,您可以计算定义异常值的间隔。

关于python - Python 中调整后的箱线图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38163562/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com