- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
编辑:我知道已经过去一年多了,但我终于对这个问题有了新的认识。要查看此问题的更新,请查看此问题:Rails 3 user matching-algorithm to SQL Query (COMPLICATED)
我在一个网站上工作,该网站根据回答的问题匹配用户。
每次用户访问另一个用户的个人资料页面时都会计算匹配百分比。因此匹配百分比不会存储在数据库中,而是一直重新计算。
现在我想构建一个搜索,用户可以在其中搜索最匹配的内容。
我的问题是,最有效的方法是什么?
如果我有 50,000 个用户并且我必须按匹配百分比列出他们怎么办?我是否必须计算一个和其他 50k 用户之间的每个匹配百分比,然后从中创建一个列表?对我来说听起来有点低效。这不会大大降低应用程序的速度吗?
我希望有人能帮我解决这个问题,因为这让我有点头疼。
编辑:为了清楚一点,这是我的用户、问题、答案、user_answers 和 accepted_answers 的数据库模型:
Tables:
Users(:id, :username, etc.)
Questions(:id, :text)
Answers(:id, :question_id, :text)
UserAnswers(:id, :user_id, :question_id, :answer_id, :importance)
AcceptedAnswers(:id, :user_answer_id, :answer_id)
Questions <-> Answers: one-to-many
Questions <-> UserAnswers: one-to-many
Users <-> UserAnswers: one-to-many
UserAnswers <-> AcceptableAnswers: one-to-many
所以有一个问题列表(以及这个问题的可能答案),用户给这些问题他们的“用户答案”,分配这个问题对他们的重要性以及他们从其他用户那里接受什么答案。
然后,如果您使用 User1 和 User2,您会查找常见的已回答问题,因此 UserAnswers 其中的 question_id 是相同的。他们有 10 个共同的问题。 User1 为前五个问题赋予了重要性值 10,为其他五个问题赋予了重要性值 20。用户 2 对两个 20 分和三个 10 分的问题给出了可接受的答案。总分70分。最高可达到的分数当然是 20x5 + 10x5 ...所以用户 2 达到了 70/150 * 100 = 46,66% ...同样的事情是相反的,用户 1 达到了用户 2 分配给这些问题的分数.然后通过几何平均值组合这 2 个百分比:sqrt of percentage1 * percentage2 ... 这给出了最终匹配百分比
最佳答案
@Wassem 的回答似乎恰到好处地解决了您的问题。我还建议您采取一种方法,根据新答案和新接受的答案更新百分比。
我创建了一个仅限数据库的解决方案 ( gist ),它可以工作,但具有额外的中间表复杂性。
理想情况下,您应该再创建两个表,一个用于重要性,另一个用于百分比匹配。当用户分配/更新答案的重要性或将某些答案标记为可接受时,您应该在这些表中创建/插入/删除行。您还可以利用 delayed_job 或 rescue 在特定操作的后台更新表。
您可能需要偶尔运行 sql 以同步两个新表中的数据,因为在某些情况下,由于并发以及更新操作的顺序可能会导致不一致。
已接受答案的更新应该是直接的,因为您只需要更新一对。但如果有人重视某个问题,则可能需要进行大量计算,并且可能需要更新大量百分比。为避免这种情况,您可能选择只维护包含每对重要性总和的表,在需要时更新它并即时计算实际百分比(在 db off-course 中)。
关于ruby-on-rails - 用户匹配系统,高效的搜索方式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7125980/
在为 Web 应用程序用例图建模时,为用户可以拥有的每个角色创建一个角色是否更好?或拥有一个角色、用户和一个具有特权的矩阵? guest < 用户 < 版主 < 管理员 1: guest 、用户、版主
我无法使用 Elixir 连接到 Postgres: ** (Mix) The database for PhoenixChat.Repo couldn't be created: FATAL 28P
这个问题已经有答案了: Group by field name in Java (7 个回答) 已关闭 7 年前。 我必须编写一个需要 List 的方法并返回 Map> . User包含 Person
感谢您的帮助,首先我将显示代码: $dotaz = "Select * from customers JOIN contracts where customers.user_id ='".$_SESS
我只想向所有用户中的一个用户显示一个按钮。我尝试了 orderByKey() 但没有成功! 用户模型有 id 成员,我尝试使用 orderByChild("id") 但结果相同! 我什至尝试了以下技巧
我们在工作中从 MongoDB 切换到 Postgres,我正在建立一个 BDR 组。 在这一步,我正在考虑安全性并尽可能锁定。因此,我希望设置一个 replication 用户(角色)并让 BDR
export class UserListComponent implements OnInit{ users; constructor(private userService: UserS
我可以使用 Sonata User Bundle 将 FOS 包集成到 sonata Admin 包中。我的登录功能正常。现在我想添加 FOSUserBundle 中的更改密码等功能到 sonata
在 LinkedIn 中创建新应用程序时,我得到 4 个单独的代码: API key 秘钥 OAuth 用户 token OAuth 用户密码 我在 OAuth 流程中使用前两个。 的目的是什么?最后
所以..我几乎解决了所有问题。但现在我要处理另一个问题。我使用了这个连接字符串: SqlConnection con = new SqlConnection(@"Data Source=.\SQLEX
我有一组“用户”和一组“订单”。我想列出每个 user_id 的所有 order_id。 var users = { 0: { user_id: 111, us
我已经为我的Django应用创建了一个用户模型 class User(Model): """ The Authentication model. This contains the u
我被这个问题困住了,找不到解决方案。寻找一些方向。我正在用 laravel 开发一个新的项目,目前正致力于用户认证。我正在使用 Laravels 5.8 身份验证模块。 对密码恢复 View 做了一些
安装后我正在使用ansible配置几台计算机。 为此,我在机器上本地运行 ansible。安装中的“主要”用户通常具有不同的名称。我想将该用户用于诸如 become_user 之类的变量. “主要”用
我正在尝试制作一个运行 syncdb 的批处理文件来创建一个数据库文件,然后使用用户名“admin”和密码“admin”创建一个 super 用户。 到目前为止我的代码: python manage.
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 6 年前。 Improv
我已在 Azure 数据库服务器上设置异地复制。 服务器上运行的数据库之一具有我通过 SSMS 创建的登录名和用户: https://learn.microsoft.com/en-us/azure/s
我有一个 ionic 2 应用程序,正在使用 native FB Login 来检索名称/图片并将其保存到 NativeStorage。流程是我打开WelcomePage、登录并保存数据。从那里,na
这是我的用户身份验证方法: def user_login(request): if request.method == 'POST': username = request.P
我试图获取来自特定用户的所有推文,但是当我迭代在模板中抛出推文时,我得到“User”对象不可迭代 观看次数 tweets = User.objects.get(username__iexact='us
我是一名优秀的程序员,十分优秀!