gpt4 book ai didi

python - 如何识别 SciKit-Learn Python 中 KNN 模型中每个簇内的记录?

转载 作者:太空宇宙 更新时间:2023-11-03 20:32:09 35 4
gpt4 key购买 nike

我正在制作一个 KNN 模型。目标变量分为2类,特征为3个分类变量(国家、语言和公司)。该模型表示最佳簇数为 5 个,因此我使用了 5 个簇。

我需要知道如何查看 5 个集群中每个集群中的记录(我的意思是模型在每个集群中分组的国家/地区、语言和公司)。有没有办法将集群的标签添加到数据框中?

我尝试过:预测 = knn.predict(features)

但这只是返回目标变量的 2 个标签的估计

我做了一些研究并发现:公里.labels_

但这仅适用于 KMeans,我正在使用 KNN

我希望有人能告诉我相应的内容或如何解决 KNN 模型的问题

最佳答案

KNN 不是聚类,而是分类

参数k不是k-means的k;它是邻居的数量而不是簇的数量...

因此,将 k 设置为 5 dors 不会突然产生 5 个标签。您的训练数据有 2 个标签,因此您将获得 2 个标签。

KNN = k 最近邻分类。对于 k=5,这意味着 5 个最近的邻居。

K 均值聚类 = 用 k 个中心向量近似数据。完全不同的k

关于python - 如何识别 SciKit-Learn Python 中 KNN 模型中每个簇内的记录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57424338/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com