作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
您可以使用 1 行代码轻松提取轮廓分数,该代码对所有集群的分数进行平均,但是如何从轮廓分数的 scikit learn 实现中提取每个中间分数?我希望能够为每个集群单独提取相同的分数,而不仅仅是获得总分。
metrics.silhouette_score(x, y, metric='euclidean')
最佳答案
如果您的数据如下所示:
num_clusters = 3
X, y = datasets.load_iris(return_X_y=True)
kmeans_model = KMeans(n_clusters=num_clusters, random_state=1).fit(X)
cluster_labels = kmeans_model.labels_
您可以使用metrics.silhouette_samples
计算每个样本的轮廓系数,然后取每个簇的平均值:
sample_silhouette_values = metrics.silhouette_samples(X, cluster_labels)
means_lst = []
for label in range(num_clusters):
means_lst.append(sample_silhouette_values[cluster_labels == label].mean())
<小时/>
print(means_lst)
[0.4173199215409322, 0.7981404884286224, 0.45110506043401194] # 1 mean for each of the 3 clusters
关于python - 如何在python中分别计算每个簇的Silhouette Score,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59919627/
我使用 scipy.cluster.hierarchy.linkage 作为聚类算法并将结果链接矩阵传递给 scipy.cluster.hierarchy.fcluster ,以获得扁平化的集群,用于
下面的链接说您可以将 CookieAuthenticator 用作无状态或有状态。 http://silhouette.mohiva.com/docs/authenticator 但是我在下面的链接中
在 Spark 中使用 KMeans 聚类时,我想使用 Silhouette 来确定 k 的最佳值。有没有最佳的并行化方法?即使其可扩展 最佳答案 不,根据定义,剪影是不可缩放的。 它使用成对距离,这
我正在对约 100 万个项目(每个表示为一个约 100 个特征向量)运行 k-means 聚类。我已经为各种 k 运行了聚类,现在想用 sklearn 中实现的轮廓分数来评估不同的结果。尝试在没有采样
我是一名优秀的程序员,十分优秀!