- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我找到了 this K-Medoids 的实现,我决定在我的代码中尝试它。
我的原始数据集是一个 21x6 矩阵。
要生成我正在使用的距离矩阵:
import scipy.spatial.distance as ssd
distanceMatrix = ssd.squareform(ssd.pdist(matr, 'cosine'))
然后我决定了一些集群:
clusters = int(np.sqrt(len(matr.data)/2))
最后:
clusters, medoids = self.cluster(distanceMatrix,clusters)
print(clusters)
print(medoids)
对于给定的输入,我得到这个输出:
[12 12 12 12 12 12 12 7 7 7 7 11 12 12 12 12 12 12 11 12 12]
[12 7 11]
虽然我期待类似于 sklearn.cluster.KMeans 的输出我的矩阵中的每个点都有一个标签。如果我想使用结果来分散簇元素,我应该如何处理这种输出,如下图(我使用 k-Means 的地方)?
最佳答案
k-medoids 使用数据点作为中心,因此 print(medoids)
将为您提供输入数据集中的中心索引,而 print(clusters)
将为您提供您数据点属于哪个组。
图中的星星将是数据集[12]、数据集[11] 和数据集[7]
关于python - 如何解释 k Medoids 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31610795/
为什么要使用 kmedoids 算法而不是 kmeans?难道仅仅是事实可在 kmeans 中使用的指标数量非常有限,还是还有更多? 是否有数据示例,选择最佳代表更有意义来自数据而不是来自 R^n 的
我正在关注一篇优秀的媒体文章:https://towardsdatascience.com/k-medoids-clustering-on-iris-data-set-1931bf781e05从头开始
我对 K-medoids 的理解是质心是从现有点中随机选取的。通过将剩余点除以最近的质心来计算聚类。计算误差(绝对距离)。 a) 如何选择新的质心?从示例中可以看出它们是随机挑选的?然后再次计算误差,
我找到了 this K-Medoids 的实现,我决定在我的代码中尝试它。 我的原始数据集是一个 21x6 矩阵。 要生成我正在使用的距离矩阵: import scipy.spatial.distan
我一直在尝试用 C++ 实现 k-medoids。到目前为止,我已经想出通过提供簇数(或种子数)来实现 k-medoids,as described in Wikipedia's k-medoids
我研究过 K-medoid 算法 (PAM) 是一种基于分区的聚类算法,是 K-means 算法的变体。它解决了K-means产生空簇和对异常值/噪声敏感的问题。 但是,K-medoid 的时间复杂度
我找不到在 Pyspark 中使用 PAM (K-medoids) 的库。 我在 Scala 中发现了这个: https://gist.github.com/erikerlandson/c3c35f0
我找不到在 Pyspark 中使用 PAM (K-medoids) 的库。 我在 Scala 中发现了这个: https://gist.github.com/erikerlandson/c3c35f0
尝试使用 fviz_cluster() 可视化 k-medoid (PAM) 聚类结果,但函数不接受它们。 它在 ?fviz_clust 中声明“对象参数 = 由函数 pam()、clara() 创建
我一直在研究和研究基于分区的聚类算法,如 K-means 和 K-Medoids。我了解到,与 K-means 相比,K-medoids 对于离群值更稳健。但是,我很好奇如果在分配数据点期间,两个或多
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
我正在阅读有关 k-means 聚类和 k-medoid 聚类之间差异的内容。 据推测,在 k-medoid 算法中使用成对距离度量(而不是更熟悉的欧几里得距离平方和来评估我们使用 k-means 发
我是一名优秀的程序员,十分优秀!