gpt4 book ai didi

r - 单变量异常值检测

转载 作者:行者123 更新时间:2023-12-04 10:13:17 24 4
gpt4 key购买 nike

这次我不会像以前在我的一个问题中那样直接询问如何检测异常值。我确实阅读了一些与此主题相关的帖子,但没有得到我需要的。我有一组值,如下所示:

y<-c(0.59, 0.61, 0.59, 1.55, 1.33, 3.50, 1.00, 1.22, 2.50, 3.00, 3.79, 3.98, 4.33, 4.45, 4.59, 4.72, 4.82, 4.90, 4.96, 7.92, 5.01, 5.01, 4.94, 5.05, 5.04, 5.03, 5.06, 5.10, 5.04, 5.06, 7.77, 5.07, 5.08, 5.08, 5.12, 5.12, 5.08, 5.17, 5.18)

现在正如大多数研究人员所说,异常值检测过程不仅取决于数据,还取决于上下文。我使用了 R 中的几个包,如异常值(grubbs 测试)、极值、mvoutlier(pcout 方法),但找不到使用它们的最佳方法。在这种情况下(取决于我的要求),7.77(31 号观测值)、7.92(20 号观测值)和 3.50(6 号观测值)是异常值。使用异常值包的 grubbs 测试,我可以将 7.77 和 7.92 检测为异常值,但不能检测到 3.50。我不知道我是否可以在这里发布我的数据图,但在查看图或分布上的数据趋势后,观察 6 将明显作为异常值。

我正在尝试为这些数据拟合非线性模型,但由于这些异常值,我找不到最佳拟合(最佳拟合不是唯一要求),无论如何我需要检测这些异常值,因为我将单独拟合对这些异常值进行建模。

我的问题很简单。我是否可以使用一些标准包来检测这 3 个异常值,或者如何使用我的非线性生成模型来帮助检测这些异常值?

此致

沙扎德

enter image description here

最佳答案

只是说我尝试使用 detectAO()正如上面所建议的,它没有发现任何与我的数据有关的东西(看起来有些相似:连续趋势中出现短峰值)。谷歌搜索后,我发现 Hempel 过滤器(函数 hempel() 来自包 pracma )可以做我需要的。我想我会在这里添加这个以防其他人正在寻找解决方案。

关于r - 单变量异常值检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13327373/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com