gpt4 book ai didi

php - 我应该使用哪种算法来查找数据库中的相似性?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:37:15 24 4
gpt4 key购买 nike

假设我的应用有 1000 个用户。我问他们 100 个问题,答案只有是/否,我将这些答案记录在单独的表格中。

现在,我希望看到对至少 20 个问题给出相同答案的人。

为了做到这一点,我应该遵循什么样的算法?谷歌搜索的相关关键字是什么?

附言我在 WAMP 环境中工作。

最佳答案

将您的答案表自身连接起来,选择共享相同 question_idanswer 但具有不同 user_id 的答案。按 user_id 对行进行分组,并使用 HAVING 子句排除匹配答案少于 20 个的行。

例如,您正在寻找与您的 user_id "1"用户相似的用户:

SELECT DISTINCT a2.user_id FROM answers a
INNER JOIN answers a2
ON a.question_id = a2.question_id
AND a.answer = a2.answer
AND a.user_id != a2.user_id
WHERE a.user_id = 1
GROUP BY a.user_id, a2.user_id
HAVING COUNT(*) >= 20;

从技术上讲,在这种情况下您不需要按 a.user_id 进行分组,但我将其留在那里以防您想要修改 WHERE 子句以返回多个 a.user_id 的结果。

关于php - 我应该使用哪种算法来查找数据库中的相似性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37761689/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com