- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
你知道我在哪里可以找到源代码(任何语言)来编写基于概率模型的信息检索系统吗?
我试着在网上搜索了一下,找到了一个叫bm25或者bmf25的算法,不知道有没有用。
基本上,我试图比较 3 种 IR 算法的性能:向量空间模型、 bool 模型和概率模型。现在我已经找到了向量空间和 bool 模型。根据结果,我们需要使用其中最好的结果来开发问答系统
提前致谢
最佳答案
如果您正在寻找实现了 BM25 的 IR 引擎,您可以尝试 Terrier IR Platform
语言是Java。您可以使用引擎本身,也可以查看源代码以了解 BM25 或其他术语加权模型的实现。
关于algorithm - 信息检索概率模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18716733/
我只是信息检索的初学者。 我正在寻求解决一个问题,即用户在输入单词时错误地在字符之间添加空格或将两个单词合并为一个,由于简单的倒排索引查找,该问题目前无法处理。 假设我对以下文档进行了倒排索引: ja
if ($cuser->loggedin()){ if (!empty($_POST['returnto'])) { header("Location: ".htmls
这是一个相当广泛的问题,我不是在寻找具体的实现(好吧,如果解决这个问题的东西已经存在,那就太棒了)。如果有人能告诉我如何检索请求的信息,那将是完美的。 让我用一个例子来描述这个问题。我有大学的名称(例
假设我有一个 FILETIME,当我在 timezone1 时它有一些值(我们可以通过将它转换为系统时间来查看)。假设我将时区更改为 timezone2。现在我想获得时区 1 中的小时和分钟(格式)时
人们经常使用 IR、ML 和数据挖掘等术语,但我注意到它们之间有很多重叠。 对于在这些领域有经验的人来说,这之间的界限到底是什么? 最佳答案 这只是一个人(受过 ML 正式培训)的观点;其他人可能会以
这个问题与不同数据库引擎对 IR 和 AI 研究的适用性有关。下面的两个重要问题以粗体显示。 我正在使用 python 将 17 gig 纯文本语料库加载到 sqlite3 中。行项目填充三个表,单个
假设我有一个用户搜索查询,如下所示:"the happy bunny" 我已经计算了 tf-idf 并且对于我正在搜索的每个文档(当然 idf 总是相同的)有这样的东西(以下是组成示例值):
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
我是一名优秀的程序员,十分优秀!