gpt4 book ai didi

python - 使用决策树比较 scikit 学习聚类

转载 作者:太空宇宙 更新时间:2023-11-04 03:34:56 24 4
gpt4 key购买 nike

我正在为一个类做一个项目,我从 LIBSVM 中获取一些数据并通过 2 种不同的聚类算法运行它。我的 kmeans 生成 8 个集群,而我的聚合算法将它们分组为 3 个集群。

现在,我试图判断由我的 kmeans 生成的聚类标签是否可用于预测由我的凝聚聚类生成的聚类标签,例如将集群#6 中的所有实例从聚合集群映射到集群#1。

我的教授建议使用决策树分类器,但我不太确定该怎么做。我知道我会将 agg 聚类标签作为类标签,然后将我的数据输入其中并查看它是如何分类的。这就是我的问题所在,我有几个问题:

1) scikit 学习决策树分类器输出什么?它是每个实例可能被归类为的概率列表吗?还是明确地对每个实例进行分类?

2) 在我输入数据后,每个实例都被分类到 Agg 生成的 3 个集群之一,我如何进入并从 kmeans 中找出它属于哪个集群?

3) 有更好的方法吗?我们需要做的就是“以定量方式比较不同方法产生的聚类”,因此我们不一定需要使用决策树分类器,但我不确定另一种好方法是什么。我已经考虑过兰特和调整后的兰特指数,但这些似乎不是我要找的东西

非常感谢任何帮助!提前致谢!

最佳答案

让我先回答3)。是的! sklearn.metrics.cluster See the documentation .这是从“真实引用”的角度编写的,但这并不是真正必要的,Adjusted Rand Index 和 Normalized Mutual Information 非常适合比较两个聚类的相似程度,并且每个聚类都会产生一个有意义的数字。

1) 要么。 predict 给出类,predict_proba 给出概率。

2)我不明白这个问题。

关于python - 使用决策树比较 scikit 学习聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29547263/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com