gpt4 book ai didi

machine-learning - 如何使用 k-means 聚类获得更多特征

转载 作者:行者123 更新时间:2023-11-30 09:44:01 25 4
gpt4 key购买 nike

我是机器学习新手,现在正在学习 k-means 聚类。对此我有很多疑问。我的 CSV 文件有 Mall_Customers

    CustomerID  Genre   Age Annual Income (k$)  Spending Score (1-100)
0 1 Male 19 15 39
1 2 Male 21 15 81
2 3 Female 20 16 6
3 4 Female 23 16 77
4 5 Female 31 17 40

我想对上面的 csv 文件执行 k 均值来预测谁在商场里花更多的钱。这里的特征是年收入和支出分数。所以我的模型给出了二维输出。如果假设我需要使用两个以上的特征变量来执行,那么那时我的模型是否会超过二维?

1 > 如何对 2 个以上的特征执行 k 均值聚类?2>如果假设我的csv文件中有5个特征字段,如何减少特征数量?

最佳答案

我分两部分回答你的问题

  1. 如果有超过 2 个特征,则 k 表示聚类发生在 n 维空间中,其中 n 是特征数。每个样本向量中的维数会发生变化,无需更改算法或方法。

  2. 如果您想减少可视化的特征数量,可以使用 PCA(主成分分析)来实现。这是一种无监督降维技术。您可以阅读更多相关内容。

要执行这两项操作,您可以使用 python sklearn 库。

关于machine-learning - 如何使用 k-means 聚类获得更多特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54861453/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com