r - 确定最佳簇数并使用 Daisy 函数和 Gower 相似度-6ren

r - 确定最佳簇数并使用 Daisy 函数和 Gower 相似度

转载作者：行者123 更新时间：2023-12-02 01:59:23

28

4

我正试图将 250 个物种的行为特征归纳为生活史策略。特征数据由数值变量和名义变量组成。我对 R 和聚类分析比较陌生，但我相信找到这些点的距离的最佳选择是在雏菊函数中使用 gower 相似性方法。 1) 这是最好的方法吗？

有了这些距离后，我想找到重要的聚类。我研究过 pvclust 并喜欢它给我集群强度的能力。但是，我无法修改代码以接受之前使用雏菊进行的距离测量。我没有成功尝试遵循此处给出的建议 https://stats.stackexchange.com/questions/10347/making-a-heatmap-with-a-precomputed-distance-matrix-and-data-matrix-in-r/10349#10349并使用此处获得的代码 http://www.is.titech.ac.jp/~shimo/prog/pvclust/pvclust_unofficial_090824/pvclust.R

2)谁能帮我修改现有代码以接受我的距离测量值？

3) 或者，是否有另一种更好的方法来确定重要聚类的数量？

在此先感谢大家的帮助。

最佳答案

一些评论...

关于 1)

这是处理不同类型数据的好方法。

您还可以在数据集中创建尽可能多的标称值新行，并将 1/0 放在需要的地方。例如，如果有 3 个标称值，例如“爬行动物”、“哺乳动物”和“鸟类”，您可以更改具有 2 列(数字，标称)的初始数据集对于具有 4 列的新列(数字、数字(代表爬行动物)、数字(代表哺乳动物)、数字(代表鸟类))实例 (23.4,"mammal") 将映射到 (23.4,0,1,0) .

使用此映射，您可以使用“正常”距离(确保标准化数据，以便没有列会因为它的大/小值而支配其他列)。

大约 2)

daisy 返回一个类型不相似的元素，您可以在 cluster 包中的其他聚类算法中使用它(也许您不必实现更多的东西)。例如函数pam可以直接得到daisy返回的对象。

大约 3)

聚类确实是主观的，大多数聚类算法都依赖于初始条件，因此“重要聚类”并不是某些人不习惯使用的术语。 Pam 在您的情况下可能很有用，因为集群使用中心点居中，这对标称数据很有用(因为它是可解释的)。例如，K-means 的缺点是质心不可解释(1/2 爬行动物 1/2 哺乳动物是什么意思？)pam 构建了以实例为中心的集群，这对于解释目的很有帮助。

关于帕姆:

http://en.wikipedia.org/wiki/K-medoids

http://stat.ethz.ch/R-manual/R-devel/library/cluster/html/pam.html

关于r - 确定最佳簇数并使用 Daisy 函数和 Gower 相似度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18002093/

28

4

0

文章推荐： java - 背景图像和文本的布局管理器

文章推荐： haskell - Haskell 中的命令行参数为 Int

文章推荐： java - 我怎样才能不间断地运行 Spark 流

R - 不同的结果 gower.dist 和 daisy(...,metric ="gower")
我想计算两个数据帧的行之间的距离(相异性)，以便为每个观察找到最接近的簇。因为我有因子和数值变量，所以我使用高尔距离。由于我想比较两个数据帧(而不是一个矩阵的行之间的差异)， gower.dist 将
r - 两个数据框的最小 Gower 距离
我正在寻找一种实现，它可以确定一个(例如 test)数据帧中所有记录与第二个(例如 training)数据帧中任何记录的 Gower 距离的最小值。结果是一个向量，其中每行一个元素 test . 数据
r - 确定最佳簇数并使用 Daisy 函数和 Gower 相似度
我正试图将 250 个物种的行为特征归纳为生活史策略。特征数据由数值变量和名义变量组成。我对 R 和聚类分析比较陌生，但我相信找到这些点的距离的最佳选择是在雏菊函数中使用 gower 相似性方法。 1
How can Gower distance be transformed into a kernel function?(如何将高尔距离转化为核函数？)
我想给一些基于高尔距离的结果赋权。核函数具有良好的性质，因此我考虑将Gower距离转换为核。但我不知道是怎么回事。。变换S=exp(Gower∗d^2)可行吗(d是γ距离)？你还有其他想法吗？如果你能

首页

博学

6Ren·AI

商城

r - 确定最佳簇数并使用 Daisy 函数和 Gower 相似度