gpt4 book ai didi

python - 使用 scikit-learn.k-means 库输出最接近每个聚类中心的 50 个样本

转载 作者:太空狗 更新时间:2023-10-29 22:05:38 25 4
gpt4 key购买 nike

我使用 python scikit-learn 库在 5000 多个样本上安装了 k-means 算法。我想将最接近聚类中心的 50 个样本作为输出。我如何执行此任务?

最佳答案

如果 km 是 k-means 模型,则数组 X 中每个点到第 j 个质心的距离是

d = km.transform(X)[:, j]

这给出了一个 len(X) 距离数组。最接近质心 j 的 50 个索引是

ind = np.argsort(d)[::-1][:50]

所以离质心最近的50个点是

X[ind]

(或者使用 argpartition,如果你有足够新的 NumPy,因为这样会快很多)。

关于python - 使用 scikit-learn.k-means 库输出最接近每个聚类中心的 50 个样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26795535/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com