mysql - 查找其他人查看的前 N 个产品(在 MySQL 中)-6ren

mysql - 查找其他人查看的前 N 个产品(在 MySQL 中)

转载作者：行者123 更新时间：2023-11-29 21:14:31

背景

我有一个如下所示的product_visits表:

create table product_visits (product_id int, visitor_id int);

insert into product_visits values
  (1, 1),
  (1, 2),
  (1, 3),
  (1, 4),
  (1, 5),
  (2, 1),
  (2, 2),
  (2, 3),
  (2, 4),
  (2, 5),
  (3, 1),
  (3, 2),
  (3, 3),
  (4, 1),
  (4, 2),
  (5, 1);

或

| product_id | visitor_id |
|------------|------------|
|          1 |          1 |
|          1 |          2 |
|          1 |          3 |
|          1 |          4 |
|          1 |          5 |
|          2 |          1 |
|          2 |          2 |
|          2 |          3 |
|          2 |          4 |
|          2 |          5 |
|          3 |          1 |
|          3 |          2 |
|          3 |          3 |
|          4 |          1 |
|          4 |          2 |
|          5 |          1 |

我当前正在使用以下 SQL 选择给定产品的访问者也访问过的前 2 个其他产品:

SELECT a.`product_id`, count(a.`product_id`) visits
FROM `product_visits` a
INNER JOIN `product_visits` b ON a.`visitor_id` = b.`visitor_id`
WHERE b.`product_id` = ?
  AND a.`product_id` != ?
GROUP BY a.`product_id`
ORDER BY visits DESC 
LIMIT 2

例如，如果运行 Product_id = 1，我将使用上述数据得到以下结果:

| product_id | visits |
|------------|--------|
|          2 |      5 |
|          3 |      3 |

当尝试一次获取一种产品的结果时，这种方法工作正常。

问题

我需要做的是重写上述查询，以便它可以通过单个查询适用于product_visits表中的所有产品。我仍然需要将结果限制为每个产品的前 n 个结果(例如 2 个)。例如，使用上述数据，我希望看到的结果如下:

| target_product_id | related_product_id | visits |
|-------------------|--------------------|--------|
|                 1 |                  2 |      5 |
|                 1 |                  3 |      3 |
|                 2 |                  1 |      5 |
|                 2 |                  3 |      3 |
|                 3 |                  1 |      3 |
|                 3 |                  2 |      3 |
|                 4 |                  1 |      2 |
|                 4 |                  2 |      2 |
|                 5 |                  1 |      1 |
|                 5 |                  2 |      1 |

我最接近实现上述目标的尝试是使用以下代码:

SELECT a.`product_id` target_product_id, b.`product_id` related_product_id, count(*) visits
FROM `product_visits` a
INNER JOIN `product_visits` b ON a.`visitor_id` = b.`visitor_id`
WHERE b.`product_id` != a.`product_id`
GROUP BY a.`product_id`, b.`product_id`
ORDER BY target_product_id ASC, visits DESC

这给了我以下结果，但仍然缺少将结果限制为每个target_product_id的前n个匹配:

| target_product_id | related_product_id | visits |
|-------------------|--------------------|--------|
|                 1 |                  2 |       5|
|                 1 |                  3 |       3|
|                 1 |                  4 |       2|
|                 1 |                  5 |       1|
|                 2 |                  1 |       5|
|                 2 |                  3 |       3|
|                 2 |                  4 |       2|
|                 2 |                  5 |       1|
|                 3 |                  1 |       3|
|                 3 |                  2 |       3|
|                 3 |                  4 |       2|
|                 3 |                  5 |       1|
|                 4 |                  3 |       2|
|                 4 |                  1 |       2|
|                 4 |                  2 |       2|
|                 4 |                  5 |       1|
|                 5 |                  3 |       1|
|                 5 |                  1 |       1|
|                 5 |                  4 |       1|
|                 5 |                  2 |       1|

我已经为此绞尽脑汁有一段时间了，但一直无法想出完整的解决方案。

更新#1

我跑了Gordon Linoff的suggested SQL下面针对我的生产数据 - 当然是在开发数据库中。我的 product_visits 表中有大约 260 万条记录。将限制设置为 2，查询运行需要 41.8572 秒。几乎所有时间(40.4 秒)都花在复制到 Tmp 表上。

通过 EXPLAIN 运行该 SQL 的输出如下:

id | select_type | table      | type   | possible_keys    | key         | key_len | ref                   | rows    | Extra                                        |
 1 | PRIMARY     | <derived2> | ALL    | NULL             | NULL        | NULL    | NULL                  | 1161898 | Using where; Using filesort                  |
 2 | DERIVED     | <derived4> | system | NULL             | NULL        | NULL    | NULL                  |       1 |                                              |
 2 | DERIVED     | <derived3> | ALL    | NULL             | NULL        | NULL    | NULL                  | 1161898 |                                              |
 4 | DERIVED     | NULL       | NULL   | NULL             | NULL        | NULL    | NULL                  |    NULL | No tables used                               |
 3 | DERIVED     | a          | index  | PRIMARY,ndx_user | ndx_product | 24      | NULL                  | 2603025 | Using index; Using temporary; Using filesort | 
 3 | DERIVED     | b          | ref    | PRIMARY,ndx_user | PRIMARY     | 116     | product_visits.a.user |       1 | Using where; Using index                     |

虽然该 SQL 几乎完全符合我的要求，但其性能却让我丧命。有什么加快速度的想法吗？

最佳答案

我认为MySQL中最简单的方法就是使用变量:

SELECT tr.*
FROM (SELECT tr.*,
             (@rn := if(@p = target_product_id, @rn + 1,
                        if(@p := target_product_id, 1, 1)
                       )
             ) as rn
      FROM (SELECT a.`product_id` as target_product_id, b.`product_id` as related_product_id, 
                   count(*) visits
            FROM `product_visits` a INNER JOIN
                 `product_visits` b
                 ON a.`visitor_id` = b.`visitor_id` AND
                    b.`product_id` != a.`product_id`
            GROUP BY a.`product_id`, b.`product_id`
            ORDER BY a.`product_id`, COUNT(*) desc
           ) tr CROSS JOIN
           (SELECT @p := -1, @rn := 0) params
      ) tr
WHERE rn <= 2
ORDER BY target_product_id ASC, visits DESC;

关于mysql - 查找其他人查看的前 N 个产品(在 MySQL 中)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36072020/

文章推荐： android - 在使用 zxing 扫描之前调用 onActivityResult

java - 无法从其他 EJB2 查找 EJB2，但可以从 servlet 查找
我在 GlassFish (J2EE_1.4) 上的 NetBeans 中开发企业项目。我的项目中有一些实体 bean、一些 session bean 和消息驱动 bean。我以如下方式使用 serv
mysql - 查找 ('first' )、查找 ('count' ) 或字段 ('id' )...哪个更快？
什么在速度方面更好...... 我正在尝试确定用户是否已将某个 URL 添加到他们的快捷方式列表中。如果他们添加了 URL，页面上就会有一个链接，用于从快捷方式中删除该页面，否则他们可以将其添加到快捷
c++ - 使用Excel模板内的OleFunction“查找”查找 header 变量，然后从C++替换它们
我的问题如下：我打开一个Excel-File，但我不知道我的客户在模板文件中使用了哪些可能的标头变量。它们可以是：＃DATE，＃TIME，＃NAME等。因此，我需要查找这些变量，以及是否已使用过：替
bash - osx 查找 exec rm 查找 : exec: unknown primary or operator
我有一堆以“-e”结尾的文件要删除。 $ find . -name "*-e" exec rm {} \; find: exec: unknown primary or operator 正则表达式是
TypeScript 查找/条件类型和联合
我有一个简单的问题:是否可以在 TypeScript 中获取联合的一部分的类型？例如，您可以经常使用如下查找类型: interface Person { name: string; } type
cuda - 查找 CUDA_SDK_ROOT_DIR
我正在尝试设置 Point Cloud Library启用 CUDA 选项的主干构建。我相信我已经按照 these instructions 正确安装了 CUDA . 在 PCL 构建的 cmake
excel - 查找/替换仅限于一列但许多工作表
我将首先说我所知道的唯一 VBA 是操作录制的宏的反复试验。我是一名注册会计师，试图以艰难的方式学习 VBA(并希望我去学校学习计算机编程!)。我有带有多个工作表的大型工作簿。 G 列中以黄色突出显
python - 查找/删除目录中最旧的文件
当文件数达到阈值时，我试图删除目录中最旧的文件。 list_of_files = os.listdir('log') if len([name for name in list_of_files
arrays - 查找、计数和索引数组中的重复项
我有一个数组，它有一些重复的值。我必须计算每个重复项的数量及其索引。打印如: Index of b: 1 Index of b: 4 Index of c: 2 Index of c: 3 Ind
Eclipse 查找/替换不起作用
我已经搜索了我的问题的解决方案，但没有成功。热键 ctrl+F 找到的 eclipse 查找/替换功能不起作用。注意:通过 Eclipse 菜单 Edit>Find Replace(不工作我的意思是
Jquery 查找 - 仅可见
我想检查 div 是否包含类为“error”的子级，但条件是错误类显示不等于无。 (意味着错误类必须可见。如何更改我的以下代码: $(".related_field").each(function
Jquery - 查找 $(this) 是什么元素
这个问题已经有答案了: 已关闭13 年前。 Possible Duplicate: Can jQuery provide the tag name? 嗨! 这个问题太基础了，我不好意思问，但我尝试了
cygwin - 查找:参数格式不正确
我一直听说这是 cygwin 的路径问题。它阻止了 emacs 在我的 cygwin 中工作。当我在 cli(不是 bash/cygwin)上执行 find 时，无论我输入什么，我都会得到同样的错误。
javascript - 查找:变量值不匹配
我正在使用此变量来获取一个或多个与我需要的值相匹配的值。 var mail = $("#dat").contents().find("td:contains('" + name + "')" ).si
javascript - 查找/合并具有共同属性的两个对象
请原谅这个长问题。我只是不确定解决这个问题的最佳方法是什么。我有一个电子表格(Google 表格)，其中包含用户和地址列表，我需要从中创建邮寄标签。该电子表格是从我们的学生信息系统导出的。这些地址应
vba - 使用范围对象中的行属性进行匹配/查找
我正在 Excel VBA 中创建一个公式，以解析单元格中以逗号分隔的“部分”列表。在另一个工作表中查找具有该零件名称的单元格，然后使用找到的该单元格的地址来获取同一行不同列的零件成本。我为此工作了数
电子邮件验证 MX 查找
我被要求在网络应用程序上实现一些电子邮件地址验证 - 我确信我们都已经经历过一千次了...但是，这一次我被要求在域上进行 MX 查找查看它是否接受电子邮件。有人知道这样做有任何潜在的问题吗？ mx
matlab - 查找.wave文件的末尾以更改MATLAB中的按钮String
我有一个切换按钮，可读取.wave文件，并且字符串更改为暂停，然后..... 我的问题是，当用户播放声音时，按钮字符串更改为暂停，结束声音后，该字符串仍为暂停状态，我想将其更改为播放。但是我不知道如何
regex - 查找/替换功能允许边界替换而不是表达式
对于令人困惑的标题提前表示歉意。我的问题如下，我在大约 600 个文件中有以下文本: $_REQUEST['FOO'] 我想将其替换为以下内容: $this->input->post('FOO') 为
Ansible INI 查找
我正在使用 Ansible 的查找功能查找 INI 文件中的值。这是文档中的示例: - debug: msg="User in integration is {{ lookup('ini', 'use

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城