- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用 Ruby on Rails 开发一种个性化的搜索引擎,我目前正在尝试根据用户的记录实时找到对结果进行排序的最佳方式。
示例:搜索的项目可以有标签(带有 id 的单独实体),例如项目有 tags=[1,
5、10、23、45]。
另一方面,用户可能已将某些标签标记为特别感兴趣,因此假设用户的标签=[5, 23]。
用于对结果进行排序的分数应考虑用户“盯着”的项目标签的数量。例如,项目的分数将是 50%,基于项目的属性,50% 的排名取决于用户(注视的标签数量)。
一个想法是将其注入(inject)信息检索系统的排序功能中。但是在我可能会使用的 Sphinx 中,实现起来会非常尴尬(当用户的向量很大时)。我不了解 Lucene/solr,但它们似乎没有我需要的高级非文本搜索功能(距离、日期、时间等)
其他选项是从 IR 系统检索中介集,然后在应用程序级别对其进行处理。但是,我很确定按顺序处理 100-1000 条记录,然后在 Rails 中对它们进行排序会非常慢。
另一方面,这似乎是可以轻松并行处理的任务 - 将 1000 条记录分成由单独的线程处理然后排序的集合。
我读到了几个 map reduce 实现,既有像 hadoop 这样的通用实现,也有像 skynet 等特定于 rails 的实现,但它们最适合大批量作业,而不是实时处理(除非我弄错了?)。
我可以为此使用任何内存中的轻型 MR 实现吗?或者,也许你有一些其他的想法如何处理它?
(旁注:我相信这个设置类似于谷歌新闻的工作方式,从我从“谷歌新闻个性化:可扩展的在线协同过滤”论文中了解到。它们实时匹配一组候选故事和一组用户所属的集群到(之前预先计算的)以个性化的方式对故事进行排序)
最佳答案
Map/Reduce 非常适合这种事情,但您可以使用中间表在 SQL 中处理它。
大概,你已经有这样的表:
用户(ID,...)
项目(id,...)
标签(id,...)
users_tags (user_id, tag_id)
items_tags (item_id, tag_id)
所以,你为什么不也维护一个这样的表:
users_items_tags (user_id, item_id, tag_id)
其中每一行的意思是“这个用户和这个项目共享这个标签”。
然后,您的搜索查询是这样的:
选择 item_id, count(tag_id) 作为分数
来自 users_items_tags
其中 user_id =
按 item_id 分组
按分数顺序排列
当用户添加标签时,
users_items_tags
更新如下:
插入 users_items_tags (user_id, item_id, tag_id)
选择
来自 items_tags
其中 tag_id =
在向项目添加标签时也是如此。删除标签时,只需删除标签和用户/项目。
此解决方案有一些问题案例。如果某个特定标签在项目中是常见的,那么当用户添加该标签时将执行大量写入,反之亦然。如果标签在项目和用户中都是通用的,那么表格将变得非常大。您必须为您的特定数据集考虑这些情况。
关于ruby-on-rails - Rails 中的 RT 并行处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/315466/
sanitize 是什么意思在 Rails 中是什么意思? 我正在阅读 CanCanCan 的文档.它说: When using strong_parameters or Rails 4+, you
在过去的几个月里,我感觉自己对 Ruby on Rails (RoR) 开发的了解达到了极限。我为大/小客户和 friend /爱好项目开发了大大小小的应用程序。我知道如何开发这些应用程序,但开始感觉
我昨天参加了一个关于扩展 Rails 的聚会,其中一个主题是 Hexagonal Rails。然而,我只做了一年的 Rails,对 MVC 结构非常满意(也许太舒服了),所以我不太了解适配器和消息队列
我使用多个 Rails 应用程序,一些在 Rails 3.2/Ruby 2.0 上,一些在 Rails 2.3/Ruby 1.8.7 上。 他们的共同点是,随着他们的成长和添加更多的依赖项/ gem
这个问题在这里已经有了答案: Using Rails-UJS in JS modules (Rails 6 with webpacker) (5 个答案) 关闭 3 年前。 我正在尝试使用 UJS
我正在开发一个当前使用 Rails 1.2 的 Rails 应用程序,所以我现在离最新的稳定版本(Rails 2.3)还有很长的路要走。 我应该如何进行迁移到更新版本的 Rails 的过程? 我应该一
尝试按照 Ryan Bates Backbone.js 教程构建抽奖应用程序,但我已经遇到了第一段代码的问题。在 application.js 的 init 函数中,他初始化了 Raffler 路由的
我正在使用 Rails 3.2 并且我有一个数据库表,我想在其中找到符合以下条件的所有行: a = true and b = true and ( 0 true, :b =>
我有一个用户类和一个联系人,其中联系人是用户的子类。这两个类都存储在用户表中。 我的联系人可能有也可能没有电子邮件地址,而我的用户需要一个电子邮件地址(我的用户模型定义中有 validates_pre
我正在编写一个教程,我在其中演示了一些 rails 命令。在我的机器上 rails和 script/rails两者都同样有效。有“首选”形式吗?两者中哪一个更普遍? 最佳答案 当您运行 rails 时
我正在寻找有关通过我的应用程序前进的最佳方式的建议,这是我首次开始集成Elasticsearch。我是一名初学者,但是热衷于深入研究,以便原谅任何明显的错误! 我遵循了http://www.sitep
我刚刚用 Rails new 启动了一个新的 Rails 应用程序,将默认数据库设置更改为 PostgresSQL。我用 bin/rails s 启动服务器,结果很奇怪 2016-04-21 05:0
我收到一个参数并希望它是这样的字符串: "abc,efg" 或者像这样的数组 ["abc","efg"] 在第一种情况下,我想将它转换成一个数组,什么是好的方法? 这是我的想法 if params[:
我刚刚用 Rails new 启动了一个新的 Rails 应用程序,将默认数据库设置更改为 PostgresSQL。我用 bin/rails s 启动服务器,结果很奇怪 2016-04-21 05:0
我收到一个参数并希望它是这样的字符串: "abc,efg" 或者像这样的数组 ["abc","efg"] 在第一种情况下,我想将它转换成一个数组,什么是好的方法? 这是我的想法 if params[:
我有 Rails 4,这是我的默认版本(我仍然希望它是)。但我不想在我的电脑上添加 rails 3.2。在以下命令中:gem install rails -v 3.2.16 我有这个警告: railt
您好,我想使用 Sheevaplug 构建一个“Rails Brick”来自 Marvell(操作系统是开箱即用的 Ubuntu,但您可以在其上安装其他发行版)。它将成为家庭服务器和静音、低成本(99
我需要能够从 Rails 控制台发送我的 Rails 应用程序的 Postgres 数据库中所有未接受的邀请。 (我有一个名为 Invitations 的表,其中包含一个名为 accepted 的 b
validate :cannot_modify_if_locked, on: :update def cannot_modify_if_locked if self.locked erro
我正在学习教程(学习 Rails 播客),需要更改以下路由语法,以便它与 Rails 3.0 兼容。谁能帮忙? map.view_page ':name', :controller => 'viewe
我是一名优秀的程序员,十分优秀!