gpt4 book ai didi

python - 如何使用原始标签获得 KMean 聚类预测

转载 作者:行者123 更新时间:2023-11-30 09:01:00 24 4
gpt4 key购买 nike

我尝试使用 sklearn KMean 聚类进行监督学习,其中每个聚类都有一个标签,当我将这些标签提供给拟合函数 model.fit(X_train, y_train) 时,结果(输出)标签不是来 self 的列表,而只是一个簇号。我可以在原始标签中获得预测吗?例如,

训练集:

x,y,z,class
1,2,3,1001
1,4,8,1002
5,2,9,1003

适合的类别是 y_train

测试集:

x,y,z
1,1,1
2,2,2
3,3,3

predicted = model.predict(X_test) 给出的结果是 [1 0 2],而预期结果是 [1002 1001 1003]。文档似乎没有标签选择的选项。如何使用提供的标签进行预测?

最佳答案

听起来您正在寻找 K 最近邻分类器。该算法从标记数据中学习,正如您所描述的那样,然后根据哪个组具有“该点的最近邻居中最具代表性的组”将测试集中的每个点分配给您的预定义组之一。这是实现:

from sklearn.neighbors import KNeighborsClassifier
neigh = KNeighborsClassifier(n_neighbors = 3) # you have 3 groups above
neigh.fit(X_train, y_train)
predicted = neigh.predict(X_test)

关于python - 如何使用原始标签获得 KMean 聚类预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37220110/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com