gpt4 book ai didi

python - pandas 数据框对象将与 sklearn kmeans 聚类一起使用吗?

转载 作者:IT老高 更新时间:2023-10-28 22:08:18 26 4
gpt4 key购买 nike

数据集是 Pandas 数据框。这是 sklearn.cluster.KMeans

 km = KMeans(n_clusters = n_Clusters)

km.fit(dataset)

prediction = km.predict(dataset)

这就是我决定哪个实体属于哪个集群的方式:

 for i in range(len(prediction)):
cluster_fit_dict[dataset.index[i]] = prediction[i]

这是数据集的样子:

 A 1 2 3 4 5 6
B 2 3 4 5 6 7
C 1 4 2 7 8 1
...

其中 A,B,C 是索引

这是使用 k-means 的正确方法吗?

最佳答案

假设数据框中的所有值都是数字,

# Convert DataFrame to matrix
mat = dataset.values
# Using sklearn
km = sklearn.cluster.KMeans(n_clusters=5)
km.fit(mat)
# Get cluster assignment labels
labels = km.labels_
# Format results as a DataFrame
results = pandas.DataFrame([dataset.index,labels]).T

或者,您可以尝试 KMeans++ for Pandas .

关于python - pandas 数据框对象将与 sklearn kmeans 聚类一起使用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28017091/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com