gpt4 book ai didi

machine-learning - 分类错误率的定义以及为什么一些研究人员使用错误率而不是准确率

转载 作者:行者123 更新时间:2023-11-30 08:53:18 25 4
gpt4 key购买 nike

分类错误率的确切定义是什么?为什么一些研究人员使用错误率而不是准确性来报告结果?我试图将我的文本分类结果与文献中的其他方法进行比较,但他们使用错误率而不是准确性,我找不到确切的定义/方程来查找我的方法的错误率。

最佳答案

对于分类,您的输出是离散的(就像您将项目放入桶中一样),因此准确性有一个非常简单的定义:

准确率 =(分类正确数)/(分类总数)

错误率同样简单:

错误率 = 1 - 准确率 = 1 - (# 分类正确)/(# 分类总数)

=(# 分类错误)/(# 分类总数)

请注意,对于具有连续输出的任务,事情要复杂得多。如果我不是将元素放入桶中,而是要求模型将元素放置在数轴上,那么准确性就不再是“正确”“错误”的问题而是我的模型与正确的有多接近。这可以是平均接近度、中位接近度等。还有更复杂的衡量标准,它们的不同之处主要在于随着距离的增加,它们对距离的权重有多大。也许稍微偏离一点点比偏离很多要好得多,所以 Root Mean Square误差测量是适当的。另一方面,无论是稍微偏离还是大幅偏离,偏离超过一个小量都可能会很糟糕,因此对数误差测量会更好。

<小时/>

回答问题的最后一部分:在离散情况下,为什么要选择准确性与误差?光学是一回事:“准确率 99%”与“错误率为 1%”所传达的心理信息不同。此外,准确率从 99% 提高到 99.9% 意味着准确度提高了 1%,但误差从 1% 降低到 0.1% 意味着误差降低了 90%,即使两者表达的是相同的现实世界改变。

否则,这可能是个人喜好或写作风格。

编辑:您可能还对 this post on the Statistics Stack Exchange 感兴趣

关于machine-learning - 分类错误率的定义以及为什么一些研究人员使用错误率而不是准确率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52865390/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com