- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想在 K-means 算法中使用 Mahalanobis 距离,因为我有 4 个高度相关的变量 (0.85)
在我看来,在这种情况下最好使用马哈拉诺比斯距离。
问题是我不知道如何在 R 中使用 K-means 算法实现它。
我想我需要在聚类步骤之前“伪造”它来转换数据,但我不知道如何。
我尝试了经典的 kmeans,在标准化数据上使用欧几里得距离,但正如我所说,相关性太多。
fit <- kmeans(mydata.standardize, 4)
最佳答案
您可以在运行算法之前重新调整数据,
使用方差矩阵的 Cholesky 分解:
变换后的欧几里得距离
是之前的马氏距离。
# Sample data
n <- 100
k <- 5
x <- matrix( rnorm(k*n), nr=n, nc=k )
x[,1:2] <- x[,1:2] %*% matrix( c(.9,1,1,.9), 2, 2 )
var(x)
# Rescale the data
C <- chol( var(x) )
y <- x %*% solve(C)
var(y) # The identity matrix
kmeans(y, 4)
mclust
中包裹。
关于r - K-means 和 Mahalanobis 距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16274788/
我有这些数据有异常值。我怎样才能找到马哈拉诺比斯的距离 并用它来去除异常值。 最佳答案 让我首先提出一些一般准则: 实际来说,如果你的特征很多而样本较少,马氏算法往往会给出误导性的结果(你可以自己尝试
我想在 K-means 算法中使用 Mahalanobis 距离,因为我有 4 个高度相关的变量 (0.85) 在我看来,在这种情况下最好使用马哈拉诺比斯距离。 问题是我不知道如何在 R 中使用 K-
我想结合使用 Mahalanobis 距离和 DBSCAN。 对于 NearestNeighbors,您可以将 metric='mahalanobis' 和 metric_params={'V': n
使用 sklearn 的 TSNE 和 mahalanobis 指标,我得到以下错误 from sklearn.manifold import TSNE tsne = TSNE( ver
我在 R 中有以下代码,用于计算 Iris 数据集上的 mahalanobis 距离,并返回一个具有 150 个值的数值向量,数据集中的每个观察值一个。 x=read.csv("Iris Data.c
我正在尝试使用 python sklearn 使用 KNN 算法进行 k 倍交叉验证网格搜索,搜索中的参数是邻居 K 的数量和距离度量。我将马哈拉诺比斯和塞几里得作为距离度量,并理解它们有一个需要指定
是否有任何选项可以在 Mahalanobis 距离中进行聚类,或者可以很容易地与 Opencv 一起使用 cv2.kmeans Python 中的函数? 最佳答案 documentation在构造函数
我正在从事人脸识别项目,并且正在使用 libfacerec。在预测标签时,库使用计算绝对差的 norm()。如何使用 Mahalanobis 距离来提高准确性? OpenCV2 有一个功能: doub
我是一名优秀的程序员,十分优秀!