gpt4 book ai didi

python - 如何在特定列上生成 kmeans?

转载 作者:行者123 更新时间:2023-11-30 09:27:47 25 4
gpt4 key购买 nike

我想对我的数据集的特定列执行 K 均值。由于这些是分类数据,我计划对其进行 onehot_encoding。现在我想知道是否可以对特定列进行 K-means 并显示所有列的结果(例如一组)?

例如,我有 col1、col2 和 col3col2 和 col3 上的 K-means 是 onehot_encoded 的,并使用 col1、col2 和 col3。我希望我已经清楚地表达了我的担忧

最佳答案

这遵循 basic documentation kmeans 的数量:

from sklearn.cluster import KMeans
#here you select your columns
X = df[['col1', 'col2', 'col3']]
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
#this will give you the groups back
kmeans.predict(X)

因此,kmeans 预测命令将为您提供可以添加到原始数据中的组。

关于python - 如何在特定列上生成 kmeans?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59614387/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com