gpt4 book ai didi

machine-learning - ROC 曲线显示奇怪的模式

转载 作者:行者123 更新时间:2023-11-30 08:36:32 25 4
gpt4 key购买 nike

ROC curves

我有一个数据集,其中添加了 10-30% 的人工数据,并运行算法来分类哪些数据是原始数据,哪些数据是人工数据。我得到了附加的 ROC 曲线。我从未见过 ROC 曲线像这样结束。难道我做错了什么?或者这样的模式是可能的吗?如果是这样,其解释是什么?

谢谢

最佳答案

如果您的目标数据具有不平衡的双峰分布,并且噪声/背景分布位于两种模式之间,您可能会看到与您所显示的类似的 ROC 曲线。最初(如您的图中所示),ROC 曲线会急剧增加,因为它覆盖了真阳性 (TP) 分布的主峰。接下来,您将获得一个相对平坦的区域,在该区域中累积误报 (FP),而 TP 不会增加太多。然后,您将遇到第二组 TP。

我猜测您的人工数据更接近 TP 主簇的质心,这就是为什么添加更多人工数据往往会削弱较小的 TP 簇并使其看起来更像典型的 ROC 曲线。

正如我在评论中提到的,在没有任何人工数据的情况下绘制 ROC 曲线将提供丰富的信息。此外,显示在 TP 率接近 1 的图尾端放大的版本可能会提供信息(即,看看它是否在接近 1 时变平)。

关于machine-learning - ROC 曲线显示奇怪的模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34881298/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com