mysql - rails : Performance issue with joining of records-6ren

mysql - rails : Performance issue with joining of records

转载作者：IT老高更新时间：2023-10-29 00:12:01

28

4

我对 ActiveRecord 和 MySQL 进行了以下设置:

用户通过成员资格拥有许多组
Group 通过成员(member)资格拥有许多用户

schema.rb 中还描述了group_id 和user_id 的索引:

add_index "memberships", ["group_id", "user_id"], name: "uugj_index", using: :btree

3 种不同的查询:

User.where(id: Membership.uniq.pluck(:user_id))

(3.8ms) SELECT DISTINCT memberships.user_id FROM membershipsUser Load (11.0ms) SELECT users.* FROM users WHERE users.id IN (1, 2...)

User.where(id: Membership.uniq.select(:user_id))

User Load (15.2ms) SELECT users.* FROM users WHERE users.id IN (SELECT DISTINCT memberships.user_id FROM memberships)

User.uniq.joins(:memberships)

User Load (135.1ms) SELECT DISTINCT users.* FROM users INNER JOIN memberships ON memberships.user_id = users.id

执行此操作的最佳方法是什么？为什么使用 join 的查询要慢得多？

最佳答案

第一个查询很糟糕，因为它将所有用户 ID 吸取到一个 Ruby 数组中，然后将它们发送回数据库。如果你有很多用户，那就是一个巨大的数组和大量的带宽，再加上 2 次到数据库的往返而不是一次。此外，数据库无法有效处理如此庞大的数组。

第二种和第三种方法都是高效的数据库驱动解决方案(一种是子查询，一种是连接)，但是你需要有合适的索引。您需要 user_id 上的memberships 表的索引。

add_index :memberships, :user_id

您已有的索引仅在您想要查找属于特定组的所有用户时才有用。

更新:

如果您的 users 表中有很多列和数据，则第三个查询中的 DISTINCT users.* 会相当慢，因为 MySQL 必须比较大量数据以确保唯一性。

要清楚:这不是 JOIN 固有的缓慢，而是 DISTINCT 的缓慢。例如:这是一种避免 DISTINCT 并仍然使用 JOIN 的方法:

SELECT users.* FROM users
INNER JOIN (SELECT DISTINCT memberships.user_id FROM memberships) AS user_ids
ON user_ids.user_id = users.id;

鉴于所有这些，在这种情况下，我相信第二个查询将是最适合您的方法。如果添加上述索引，第二个查询应该比原始结果中报告的更快。如果您在添加索引后还没有这样做，请重试第二种方法。

虽然第一个查询本身存在一些缓慢的问题，但从您的评论来看，很明显它仍然比第三个查询快(至少对于您的特定数据集而言)。这些方法的权衡将取决于您的特定数据集，即您拥有多少用户以及您拥有多少成员(member)资格。一般来说，我认为第一种方法仍然是最差的，即使它最终更快。

另外，请注意我推荐的索引是专门为您在问题中列出的三个查询而设计的。如果您对这些表有其他类型的查询，您可能会更好地使用额外的索引，或者可能是多列索引，正如@tata 在他/她的回答中提到的那样。

关于mysql - rails : Performance issue with joining of records，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33128110/

28

4

0

文章推荐： mysql - 将 MYSQL 表导出为 CSV 时如何处理空字段

文章推荐： linux - 通过 SSH 服务器获取 SCP 到本地的权限被拒绝

文章推荐：交叉编译 "OpenSSL"错误

文章推荐： php - 如何解决一般错误 : 2006 MySQL server has gone away

join - 从一个“join”表到另一个“join”表的SqlAlchemy关系
我正在测试设置SQLAlchemy以映射现有数据库。这个数据库是很久以前自动建立的，它是由我们不再使用的先前的第三方应用程序创建的，因此 undefined 某些预期的事情，例如外键约束。该软件将管理
mysql - INNER JOIN、LEFT JOIN、RIGHT JOIN 和 FULL JOIN 有什么区别？
这个问题在这里已经有了答案: What is the difference between "INNER JOIN" and "OUTER JOIN"? (28 个答案) 关闭 7 年前。 INNE
mysql - INNER JOIN、LEFT JOIN、RIGHT JOIN 和 FULL JOIN 有什么区别？
这个问题在这里已经有了答案: What is the difference between "INNER JOIN" and "OUTER JOIN"? (29 个回答) 关闭7年前. INNER J
join - Hive:LEFT JOIN 与 JOIN 在 ON 子句中使用过滤器给出不同的结果
假设有两个表: table1.c1 table1.c2 1 1 A 2 1 B 3 1 C 4 2
join - Hive:LEFT JOIN 与 JOIN 在 ON 子句中使用过滤器给出不同的结果
假设有两个表: table1.c1 table1.c2 1 1 A 2 1 B 3 1 C 4 2
数据库Left join , Right Join, Inner Join 的相关内容，非常实用
一.先看一些最简单的例子例子 Table A aid adate 1 a1 2&nb
SQL 外链接操作小结 inner join left join right join
数据库操作语句 7. 外连接——交叉查询 7.1 查询 7.2 等值连接 7.3 右外
ruby-on-rails - :joins | change behavior inner join to left join
我有两个表 'users' 和 'lms_users' class LmsUser belongs_to :user end class User has_one :lms_user
ruby-on-rails - 首先使用 `joins()` 进行 INNER JOIN 然后是下一个表的 LEFT JOIN
我试图避免在 Rails 中对我的 joins 进行字符串插值，因为我注意到将查询器链接在一起时灵活性会降低。也就是说，我觉得 joins(:table1) 比 joins('inner join
ruby-on-rails - Rails ActiveRecord :joins with LEFT JOIN instead of INNER JOIN
我有这个代码 User.find(:all, :limit => 10, :joins => :user_points, :select => "users.*, co
join - Doctrine join 绕过延迟加载
我刚刚开始探索 Symfony2，我很惊讶它拥有如此多的强大功能。我开始做博客教程在: http://tutorial.symblog.co.uk/ 但使用的是 2.1 版而不是 2.0 我的问题是我
SQL JOIN 和不同类型的 JOIN
什么是 SQL JOIN什么是不同的类型？最佳答案插图来自 W3schools : 关于SQL JOIN 和不同类型的 JOIN，我们在Stack Overflow上找到一个类似的问题： http
join - Hive Join 返回零记录
我有两个 Hive 表，我正在尝试加入它们。这些表没有被任何字段聚集或分区。尽管表包含公共(public)键字段的记录，但连接查询始终返回 0 条记录。所有数据类型都是“字符串”数据类型。连接查询很
join - solr join - 返回父子文档
我正在使用 Solr 的(4.0.0-beta)连接功能来查询包含具有父/子关系的文档的索引。连接查询效果很好，但我只能在搜索结果中获得父文档。我相信这是预期的行为。但是，是否有可能在搜索结果中同时
join - 三向关联查询/has_many :through/join
我正在使用可用的指南/api/书籍自学 Rails，但我无法理解通过三种方式/嵌套 has_many :through 关联进行的连接。我有用户与组相关联:通过成员(member)资格。我在多对多
SQL JOIN 和不同类型的 JOIN
什么是 SQL JOIN，有哪些不同的类型？最佳答案插图来自 W3schools : 关于SQL JOIN 和不同类型的 JOIN，我们在Stack Overflow上找到一个类似的问题： htt
Mysql join 使所有 join
我正在尝试访问数据库的两个表。在商店里，我保留了一个事件列表，其中包含 Table Event id, name,datei,houri, dateF,Hourf ,capacity, age ,de
mysql - 复杂连接(Joining Joins)
我有 4 个表:booking、address、search_address 和 search_address_log 表:(相关列) 预订:(pickup_address_id, dropoff_a
Joining after join with yq(在与yq连接之后进行连接)
我在YML中有以下结构：。我正试着创造一个这样的结构：。作业名称和脚本用~分隔，作业用；分隔。。我可以使用以下命令使其正常工作。然而，我想知道是否可以用一个yq表达式来完成，而不是通过管道再次使用yq
Joining after join with yq(在与yq连接之后进行连接)
我在YML中有以下结构：。我正试着创造一个这样的结构：。作业名称和脚本用~分隔，作业用；分隔。。我可以使用以下命令使其正常工作。然而，我想知道是否可以用一个yq表达式来完成，而不是通过管道再次使用yq

首页

博学

6Ren·AI

商城

mysql - rails : Performance issue with joining of records

3 种不同的查询: