gpt4 book ai didi

python - 如何在 k-Means 聚类算法中选择哪些列适合可视化?

转载 作者:行者123 更新时间:2023-11-30 09:40:22 27 4
gpt4 key购买 nike

我试图了解 csv 文件中列的选择,在应用 k-means 时应考虑这些列。在下面的链接中,仅将年收入和支出得分作为一列(来自 Mall_Customers.csv 文件)以进行可视化,而不是年龄。 https://www.kaggle.com/shrutimechlearn/step-by-step-kmeans-explained-in-detail

请帮忙。

最佳答案

它们有 3 个可用于集群的功能。通常他们只会采用所有特征的欧氏距离来获得簇与簇之间的距离。

这很容易在二维中可视化。取两点,它们之间的距离就是三角形的斜边。在三维空间中,想象起来有点困难。作者只是使用二维,以便她稍后可以绘制它。但是,要使用所有三个维度,您只需将代码修改为:

X = dataset.iloc[:,[1:3]].values

这将在算法中使用年龄、收入和支出分数

关于python - 如何在 k-Means 聚类算法中选择哪些列适合可视化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59123264/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com