gpt4 book ai didi

cluster-analysis - 来自分类或聚类结果的 ROC 曲线

转载 作者:行者123 更新时间:2023-12-02 01:17:19 25 4
gpt4 key购买 nike

假设我使用例如 k-means 将包含 1000 个实例的 5 个类的训练数据集聚类为 5 个聚类(中心)。然后我通过验证测试数据集构建了一个混淆矩阵。然后我想用它绘制 ROC 曲线,这怎么可能?

最佳答案

Roc 曲线显示真阳性率和假阳性率之间的权衡。也就是说

ROC graphs are two-dimensional graphs in which TP rate is plotted on the Y axis and FP rate is plotted on the X axis ROC Graphs: Notes and Practical Considerations for Researchers

当您使用离散分类器时,该分类器只会在 ROC 空间中产生一个点。通常你需要一个产生概率的分类器。您更改分类器中的参数,以便您的 TP 和 FP 率发生变化。之后,您使用这些点绘制 ROC 曲线。

假设您使用 k-means。 K-means 离散地为您提供集群成员资格。一个点属于 ClusterA 或 .. ClusterE。因此,从 k-means 输出 ROC 曲线并不简单。 Lee and Fujita描述了一个算法。你应该看看他们的论文。但是算法是这样的。

  1. 应用 k-means
  2. 使用测试数据计算 TP 和 FP。
  3. 将数据点的成员从一个集群更改为第二个集群。
  4. 再次使用测试数据计算 TP 和 FP。

如你所见,他们在 ROC 空间中获得了更多的点,并使用这些点来绘制 ROC 曲线

关于cluster-analysis - 来自分类或聚类结果的 ROC 曲线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9804724/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com