gpt4 book ai didi

python - sklearn : Get Distance from Point to Nearest Cluster

转载 作者:行者123 更新时间:2023-11-28 22:27:29 25 4
gpt4 key购买 nike

我正在使用像 DBSCAN 这样的聚类算法。

它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定它到最近集群的距离,以获得类似该点异常程度的度量标准。这可能吗?或者这种指标是否有任何替代方案?

最佳答案

答案将取决于您选择的链接策略。我举一个单链接的例子。

首先,您可以构建数据的距离矩阵。

from sklearn.metrics.pairwise import pairwise_distances
dist_matrix = pairwise_distances(X)

然后,您将提取最近的集群:

for point in unclustered_points:
distances = []
for cluster in clusters:
distance = dist_matrix[point, cluster].min() # Single linkage
distances.append(distance)
print("The cluster for {} is {}".format(point, cluster)

编辑:这有效,但如 Anony-Mousse 所述,它是 O(n^2)。考虑核心点是一个更好的主意,因为它可以减少你的工作量。另外,它有点类似于centroid linkage。

关于python - sklearn : Get Distance from Point to Nearest Cluster,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44041347/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com