gpt4 book ai didi

python - 使用 Scikit-learn KMeans 对多维数组进行聚类

转载 作者:行者123 更新时间:2023-12-05 02:10:41 24 4
gpt4 key购买 nike

我搜索了一些关于使用 Scikit-learn 的 KMeans 的教程,但我找不到适合我的案例的内容。

我有一个包含多个对象的数组,其格式为

{
name: 'Bob',
vector: [14,12,15,10,16,16,7,15,7,4,16,13,4,16,13,17,13,13,10,8,14,17,10,16,6,14,16,13,15,17,12,7,14,13,15,10]
}

所以,我有这些对象的数组 [ {...}, {...}, ... ]

我想使用这些对象的 vector 字段来使用 KMeans 来获得相似项目的集群。

向量值被归一化到 1 到 20 之间。

任何帮助都会很棒。谢谢。

最佳答案

导入库

from sklearn.cluster import KMeans
import numpy as np

为 Scikit-learn 的 KMeans 工作格式化你的 array of these objects

data_for_clustering = [row['vector'] for row in data]
data_for_clustering = np.array(data_for_clustering)

聚类

kmeans = KMeans(n_clusters=2, random_state=0).fit(data_for_clustering)

获取标签

kmeans.labels_

关于python - 使用 Scikit-learn KMeans 对多维数组进行聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58425921/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com