- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个文档数据库,我可以在其中执行搜索。对于每一次搜索,都有 n 个肯定。现在,如果我通过 precision@k 和 recall@k 来评估搜索的性能,那么对于后者来说一切都很好:
recall@k = 真阳性/positives = 真阳性/n
真阳性的数量在 [0, n] 范围内,因此 recall@k 在 [0, 1] 范围内 - 完美。然而,关于 precision@k 的事情变得很奇怪。如果我计算
精度@k = tp/(tp + fp) = tp/k
precision@k 在 [0, n/k] 范围内,这对我来说意义不大。例如考虑边缘情况 n=1。不能增加 tp,因为正数不超过 n 个,也不能减少 k,因为好吧,它叫做 precision@k,不是吗?
我哪里错了?
可以在 [1] 图 8b 中找到我正在谈论的示例。您可以看到前 1..200 个查询结果的精确召回曲线。尽管数据库中只有不到 200 个阳性,但准确率还是相当高的。
[1] https://www.computer.org/csdl/pds/api/csdl/proceedings/download-article/19skfc3ZfKo/pdf
最佳答案
由于 precision@k
被计算为 #num_relevant/k
,它的最大值可能是 1(如果检索列表中的所有 k 个排名靠前的文档是相关)。
你的论点是正确的,因为如果#relevant_docs 小于 k 那么你就会被 P@k 指标错误地惩罚,因为在这种情况下即使有完美的检索你也不会得分 1
关于指标。
因此,一个标准的解决方案是同时考虑和计算精度值,而不是在任意 k 值处,而是在召回点处,即在您的排名列表中检索到相关文档的那些位置.然后,您最终会将总和除以相关文档的数量。此度量称为平均精度* (MAP)。下面是计算 MAP 的示例。
假设您检索了 10
个文档,其中 2
与排名 2
和 5
相关(并且总共有 3
个相关文档 - 其中一个未检索到)。
您在召回点(k = 2 和 5 的值)计算 precision@k。
这给出:
1/2 (at position 2, one is relevant out of 2) +
2/5 (at position 5, one 2 are relevant out of 5)
然后将此数字除以 3(已知相关文档的总数)。最后一步有利于实现高召回率的系统,而基于分界点的精度有利于将文档检索到最高排名的系统。
请注意,系统 A 以更高的排名检索相关文档并检索更多的相关文档,其得分要高于无法满足其中一种或两种情况的系统。
另请注意,如果您在总共检索到的 10 个文档中检索到排名前 3 的 3 个相关文档(选中此),您将在此指标上获得满分 1
,这些文档解决了您的担忧激发了这个问题。
关于precision - Top k精度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63850906/
关于这个话题已经说了很多,但是我找不到我的问题的确切答案。 JavaScript 无法准确表示 0.1 等小数,这是可以理解的。 例如,由于乘法运算期间发生舍入误差,这是正确的: 0.1 * 3 ==
在 zig 中,可以使用“{d}”以十进制表示法打印浮点值。这将自动以全精度打印该值。有没有办法指定位数?是针对每个值,还是作为某种全局设置? 最佳答案 这将限制小数点后的位数,四舍五入和零填充: f
我正在进行的项目需要高精度。减法时我遇到的问题在这里说明: >> 1-0.9999999999999999 ans = 1.1102e-16 >> 1-0.99999999999999999 ans
是否可以使变量本身的精度成为将在运行时定义的变量? 说,如果我尝试编译: SUBROUTINE FOO( VARIABLE, PRECISION_VALUE ) IMPLICI
我正在查询 SQLite 数据库以获取纬度/经度详细信息。 SELECT * FROM tblMain where latitude > -33.866 and latitude 151.20
我一直使用下划线将整数定义为 Fortran 中的特定类型。 下面是一段代码,用于演示 1_8 的含义,例如: program main implicit none integer(2)
我正在寻找一种方法来告诉 pint 要打印多少个有效数字。例如,当我输入以下内容时: import pint ureg = pint.UnitRegistry() print(3*ureg.m /9)
我正在从事一个项目,目标是从山上追踪动物。在第一个实地考察季中,我们使用了 OpenTags 和经过校准的摄像头,虽然可以正常工作,但需要大量的处理/校准,而且至关重要的是,当系统出现问题时无法提供任
在 JavaScript 中有没有一种方法可以确定一个数除以另一个数是否会得到整数?就像 18.4/0.002 给我们 9200,但是 18.4/0.1 给我们 183.99999999999997。
我正在尝试使用 Big.js 在 javascript 中完成此计算 r = (a * b)/ sqrt( ( a*sin(θ) )^2 + ( b*cos(θ) )^2 ) 我也试过 math.js
我有这个片段着色器代码,它在 iOS 模拟器(非视网膜)和 iPad2(非视网膜)之间显示不同: highp vec2 textCoord; textCoord.x = gl_Fr
这个问题在这里已经有了答案: C++ calculating more precise than double or long double (2 个答案) 关闭 6 年前。 是否有任何浮点类型在小
我似乎一直困惑的三个问题: 为什么代码是 x & ~077比这行代码 x & 0177700 更好。是因为精度损失较小吗? 为什么此代码对于设置数字中的第 5 位不正确? num = num + 0x
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Precision of Floating Point 我正在尝试使用一些 float 来计算概率,但我的最
由于微 Controller 的精度,我定义了一个包含两个 float 比率的符号,而不是直接写结果。 #define INTERVAL (0.01F/0.499F) 代替 #defi
我试图比较这 3 种搜索算法,起初我使用 time.h 库但没有任何反应,输出始终是 0.00000 秒。现在我试图在循环中使用一些计数器。但我在这里也有问题, 任何人都可以帮我处理代码吗? 这是我的
char buf[10]; int counter, x = 0; snprintf (buf, sizeof buf , "%.100d%n", x, &counter); printf("Coun
我注意到在评估向量时对我来说是不可预测的行为。直接执行它与在循环中进行索引似乎是完全不同的。谁能帮我解决这个问题?我知道可能在它如何进行每个操作中都有解释,所以我需要一些关于如何查找它的键 多谢指教提
我想在我的应用程序中使用精确的 gps 定位。所以我遵循了一个简单的教程(LocationManager 的基本用法,明确要求 GPS 提供商,要求更新 0 ms,0 m)并创建了一个应用程序。我对更
float 在 1.0f 和 0.0f 之间有多少位精度,这样每个值都可以唯一表示? 例如,如果第一个小数 float 不能表示 0.13f,答案就是 float 只有一位精度。 最佳答案 std::
我是一名优秀的程序员,十分优秀!