gpt4 book ai didi

r - 识别与从PCA和QQ图去除离群

转载 作者:行者123 更新时间:2023-12-04 22:21:12 24 4
gpt4 key购买 nike

我有一个132×107的数据集,其由2种患者类型的 - (患者1的33)和(患者2的99)。

我在寻找离群所以我一日4个组件的数据集和done qqplots运行PCA,使用下面的命令

pca = prcomp(data, scale. = TRUE)
plot(pca$x, pch = 20, col = c(rep("red", 33), rep("blue", 99)))

当我使用第二部分的qqplot:
qqPlot(pca$x[,2],pch = 20, col = c(rep("red", 33), rep("blue", 99)))     

下图显示了2个清楚异常值 - 在左下角的红点,其是患者1秒。

有没有出在这些数据点的指数的工作,使他们可以被删除的任何简单的方法?

最佳答案

出于某种原因,我不相信鉴定方法支持
car包(qqPlot()的来源)

让我们来看看USArrests数据的PCA ...

pca <- prcomp(USArrests) 

这个使用 qqPlot的情节是很容易的。
require(car)
qqPlot(pca$x[,2],pch = 20, col = c(rep("red", 33), rep("blue", 99)))

然而, qqPlot()不允许通过 identify()点选择。
identify(qqPlot(pca$x[,2],pch = 20, col = c(rep("red", 33), rep("blue", 99))))
# numeric(0)

你可以,但是,请在 qqnorm()套餐使用 stats的。
identify(qqnorm(pca$x[,2],pch = 20, col = c(rep("red", 33), rep("blue", 99))))

这将产生一个不太复杂的图形,但你应该能够通过手动 qqline()(也 stats)和多一点的数学添加一行和置信区间。

关于r - 识别与从PCA和QQ图去除离群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19683379/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com