gpt4 book ai didi

statistics - 如何在 mahout 中解释 IRStatisticsImpl 数据

转载 作者:行者123 更新时间:2023-12-01 03:56:57 25 4
gpt4 key购买 nike

我想阅读 IRStatisticsImpl数据,但有一些问题:

我的结果是:

IRStatisticsImpl[precision:0.04285714285714287,recall:0.04275534441805227,fallOut:0.0018668022652391654,nDCG:0.04447353132522083,reach:0.997624703087886]

这是否意味着,我只得到了 4% 的好的推荐(精确度)和大约相同水平的坏推荐(召回)?

最好的数字应该是什么样的——精度为 1.0,召回率为 0.0?

最佳答案

好吧,根据定义:

Precision 表示您的结果集中有多少结果是正确的。
召回表示测试集中正确元素必须被选为正确元素并在结果集中挑选的概率。

要做到完美,Precision 和 Recall 都应该是 100%。必须根据您的领域评估关于这些值的良好结果和标准。

例如,如果您有一个包含好蘑菇和坏蘑菇的桶,那么无论您的召回率有多低,您都应该以 100% 的精度为目标。因为精度对您的健康至关重要,所以您甚至可以留下很多好蘑菇。重要的是不要吃丑的。
你可以选择一个好蘑菇,所以你得到 100% 的准确率,但如果你的桶里有四个好蘑菇,你的召回率为 25%。
理想情况下,如果准确率和召回率都是 100% 意味着在你的结果集中你所有的蘑菇都是好的,还有所有好的蘑菇都在你的结果集中,没有一个留在你的测试集中。

所以值可能有不同的含义。

可悲的是,你的结果看起来很丑陋,因为你有很多误报和太多的漏报。

看看here .

关于statistics - 如何在 mahout 中解释 IRStatisticsImpl 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16478192/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com