- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我对如何评估信息检索结果的好坏有疑问,比如计算
相关文档rank, recall, precision ,AP, MAP.....
目前,一旦用户输入查询,系统就能够从数据库中检索文档。问题是不知道怎么评价。
我得到了一些公共(public)数据集,例如“Cranfield collection”dataset link它包含
1.文档 2.查询 3.相关性评估
DOCS QRYS SIZE*
Cranfield 1,400 225 1.6
我可以知道如何使用“Cranfield collection”来计算评估吗相关文档rank, recall, precision ,AP, MAP.....
我可能需要一些想法和方向。不询问如何编写程序。
最佳答案
文档排名
Okapi BM25(BM 代表最佳匹配)是搜索引擎用来根据匹配文档与给定搜索查询的相关性对匹配文档进行排名的排名函数。它基于概率检索框架。 BM25 是 bag-of-words检索功能,它根据每个文档中出现的查询词对一组文档进行排名,而不管文档中查询词之间的相互关系(例如,它们的相对接近度)。查看Wikipedia页面了解更多详情。
准确率和召回率
“在我们检索到的所有相关文档中,有多少是真正相关的?”的精确度测量。
Precision = No. of relevant documents retrieved / No. of total documents retrieved
召回措施“在所有实际相关文档中,我们检索到多少是相关的?”。
Recall = No. of relevant documents retrieved / No. of total relevant documents
假设,当一个查询“q”被提交给一个信息检索系统(例如,搜索引擎)时,它有 100 个相关文档 w.r.t。查询“q”,系统从 600 份文档中检索出 68 份文档。在检索到的 68 份文件中,有 40 份文件是相关的。所以,在这种情况下:
Precision = 40/68 = 58.8%
和 Recall = 40/100 = 40%
F-Score/F-measure 是准确率和召回率的加权调和平均值。传统的 F-measure 或平衡 F-score 是:
F-Score = 2 * Precision * Recall / Precision + Recall
平均精度
您可以这样想:您在 Google
中输入内容,它会显示 10 个结果。如果所有这些都是相关的,那可能是最好的。如果只有一些是相关的,比如其中五个,那么最好首先显示相关的。如果前五名无关紧要而好的只从第六名开始,那就太糟糕了,不是吗? AP 分数反射(reflect)了这一点。
举个例子:
AvgPrec of the two rankings:
排名#1:(1.0 + 0.67 + 0.75 + 0.8 + 0.83 + 0.6)/6 = 0.78
排名 #2:(0.5 + 0.4 + 0.5 + 0.57 + 0.56 + 0.6)/6 = 0.52
平均精度 (MAP)
MAP 是跨多个查询/排名的平均精度的平均值。举例说明。
Mean average precision for the two queries:
对于查询 1,AvgPrec: (1.0+0.67+0.5+0.44+0.5)/5 = 0.62
对于查询 2,AvgPrec: (0.5+0.4+0.43)/3 = 0.44
因此,MAP = (0.62 + 0.44)/2 = 0.53
有时,人们使用precision@k
、recall@k
作为检索系统的性能度量。您应该为此类测试构建一个检索系统。如果你想用 Java 编写程序,你应该考虑 Apache Lucene建立您的索引。
关于information-retrieval - IR评估中如何衡量ranking、AP、MAP、recall的一些想法和方向,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40801196/
所以这个有点难以解释,但我会尝试一下: 我有一个带有 .boxes 类的 div。它是一些循环元素的包装。循环元素具有类.box。在这个元素中,还有两个元素。一种是 .box-header 类的 he
我有一个网站,我试图在调整浏览器窗口大小时使其表现得体。例如,我希望在有人缩小浏览器窗口时调整横幅图像的大小。网址是http://www.pfp-consortium.org 顶部的横幅在 CSS 中
我想知道情况,是将所有可能的元素都放在表单中更好,还是在用户需要时立即将元素添加到表单中更好。 我将尝试对其进行更多解释 - 我的表单具有 4 个输入和一个文本区域。然后我提供了可选值(大约 15 -
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
所以我一直在研究我正在构建的一个论坛,并且一直专注于它的一个方面,即如何在不在数据库中存储大量数据的情况下跟踪未读的帖子和通知。在查看了一些解决方案之后,我相信我想出了一个可能适合我需要的解决方案,但
编写一个高质量的软件应该是第一步。现在这是一个移动的目标。(我们有一些类似于 https://stackoverflow.com/questions/3716203/automatic-code-qu
我有一组存储在数组中的二维点。 我需要尽可能多地压缩它。最好是快速,但不要破坏交易,压缩率是目标。规则是: 一个点=一个32位的结构,存储为(x,y),每个坐标2个字节 坐标 = 8 位整数部分和 8
我的一个应用程序从服务器下载数据库。当我将应用程序安装到我的手机上时,它会正确下载文件并加载信息,没有抛出任何异常或任何东西。 但是,当我将 apk 上传到 Android Market Place
我们最近接到一位客户的电话,提示他们网站的页面底部有一些“看起来很奇怪的代码”。我们查看了源代码,发现 templates/master 中附加了大约 800 字节的恶意 javascript 代码。
以编程方式创建系统还原点是“禁忌”吗?我会在执行软件更新之前执行此操作。如果有更好的方法可以仅使用我的软件文件和数据创建还原点,请告诉我。 我想要一种方法,如果在更新期间一切都发生了故障(关闭/终止更
我有一个有很多相关模型的类问题。在我的应用程序的一个页面上,我列出了所有当前问题的摘要,以及来自相关记录的各种信息。最终,这是一个值的散列,然后我将其打印到一个 csv 样式的行中(从这里我将其称为“
我目前正在尝试从 NSClassFromString(NSString *) 方法创建对象。 我希望能够实现的是以下... NSClassFromString(stringType) *pageCon
使用 Intellij 想法,我如何找出使变量可见的原因? 困难时的示例: 假设你看 class A ,你会看到一个变量 something .如果你跳转到源代码,你会看到它是在 trait X 中定
在IntelliJ IDEA的代码样式设置中,没有.gradle文件的任何子类别(例如build.gradle),在“其他文件类型”下,没有任何选项可以修改花括号位置。我没有找到为.gradle文件设
我正在尝试按照here指令运行docker-compose,但它似乎陷入了循环。在安装Docker之前,我能够调出示例站点并进行一些外观上的更改,但是尝试使用docker-compose生成缩略图23
我正在使用 IntelliJ IDEA 12.1.4 来调试 Grails 应用程序。我开始调试 session 大约需要 2 分钟。我想尽可能避免重新启动。 我正在尝试调试一个 Controller
随着 .NET 4.0 的出现,MS AJAX 是否仍占有一席之地,或者您认为 JQuery 是否会扩展以包含 AJAX 的全部功能,并使我们所知的 MS AJAX 变得多余? 最佳答案 请记住,AS
需要帮助运行此示例 Google+ API Quickstart w/C# 应用程序,请使用 VS2015 并按照此处的说明操作:https://developers.google.com/+/web
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我有一个相当“疯狂”的想法,即在我的应用程序中拥有一个“存储过程”设施。基本上,我的应用程序以数据为中心,它可以通过某种形式的 Restful 界面访问数据存储。 我希望拥有以多种方式操作数据(这是一
我是一名优秀的程序员,十分优秀!