sql - "ORDER BY"当结果集很大并且不能按索引排序时优化-6ren

sql - "ORDER BY"当结果集很大并且不能按索引排序时优化

转载作者：行者123 更新时间：2023-12-03 17:26:44

25

4

当我不能使用索引来满足行的排序时，如何使具有小 LIMIT(即一次 20 行)的 ORDER BY 子句快速返回？

假设我想从表“节点”(简化如下)中检索一定数量的标题。顺便说一下，我正在使用 MySQL。

node_ID INT(11) NOT NULL auto_increment,
node_title VARCHAR(127) NOT NULL,
node_lastupdated INT(11) NOT NULL,
node_created INT(11) NOT NULL

但我需要将返回的行限制为仅特定用户有权访问的行。许多用户可以访问大量节点。我在一个大的查找表中预先计算了这些信息(试图让事情变得更容易)，其中主键覆盖了两列，一行的存在意味着用户组可以访问该节点:

viewpermission_nodeID INT(11) NOT NULL,
viewpermission_usergroupID INT(11) NOT NULL

因此，我的查询包含类似

FROM
  node
  INNER JOIN viewpermission ON
    viewpermission_nodeID=node_ID
    AND viewpermission_usergroupID IN (<...usergroups of current user...>)

...而且我还使用了 GROUP BY 或 DISTINCT，这样即使用户的两个“用户组”都有权访问该节点，节点也只会返回一次。

我的问题是，按创建日期或上次更新日期对结果进行排序的 ORDER BY 子句似乎无法使用索引，因为返回的行取决于其他 viewpermission 表中的值。

因此 MySQL 需要找到所有符合条件的行，然后自己对它们进行排序。如果特定用户有 100 万行，并且我们想查看最新的 100 行或按上次更新排序的第 100-200 行，则 DB 需要确定用户可以看到哪一百万行，排序整个结果集本身，在它可以返回那 100 行之前，对吗？

有什么创造性的方法可以解决这个问题吗？我一直在思考:

以某种方式将日期添加到查看权限查找表中，以便我可以构建一个包含日期和权限的索引。我猜是有可能的。

编辑:简化问题

也许我可以通过像这样重写来简化问题:

有什么方法可以重写此查询或为以下内容创建索引，以便可以使用索引进行排序(而不仅仅是选择行)？

SELECT nodeid
FROM lookup
WHERE
  usergroup IN (2, 3)
GROUP BY
  nodeid

(usergroup) 上的索引允许索引满足 WHERE 部分，但 GROUP BY 强制在这些行上使用临时表和文件排序。 (nodeid) 上的索引对我没有任何作用，因为 WHERE 子句需要一个以 usergroup 作为第一列的索引。 (usergroup, nodeid) 上的索引强制临时表和文件排序，因为 GROUP BY 不是索引的第一列可以变化。

任何解决方案？

最佳答案

我可以回答我自己的问题吗？

我相信我已经发现做我所描述的事情的唯一方法是让我的查找表为一个人可能想要成为成员的用户组的每个可能组合都有行。

选择一个简化的例子，而不是这样做:

SELECT id FROM ids WHERE groups IN(1,2) ORDER BY id

如果您需要使用索引来选择行并对其进行排序，则必须将 IN(1,2) 抽象为常量而不是范围，即:

SELECT id FROM ids WHERE grouplist='1,2' ORDER BY id

当然，除了使用字符串“1,2”之外，您还可以在那里使用外键等。关键是您不仅必须为每个组而且为多个组的每个组合都有一行。

所以，这就是我的答案。

无论如何，对于我的应用程序，我觉得为每个节点维护所有可能的用户组组合是不值得的。出于我的目的，我预测大多数节点对大多数用户都是可见的，所以我觉得简单地让 GROUP BY 使用索引是可以接受的，因为过滤并不那么需要它。

换句话说，我对原始查询采用的方法可能类似于:

SELECT
    <fields>
FROM
  node
  INNER JOIN viewpermission ON
    viewpermission_nodeID=node_ID
    AND viewpermission_usergroupID IN (<...usergroups of current user...>)
  FORCE INDEX(node_created_and_node_ID)
GROUP BY
  node_created, node_ID

如果 GROUP BY 从索引的最左侧列开始，并且它位于要处理的第一个非常量非系统表中，则它可以使用索引。然后连接处理整个列表(已经排序)，只有那些对当前用户不可见的(将是一小部分)被 INNER JOIN 删除。

关于sql - "ORDER BY"当结果集很大并且不能按索引排序时优化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/588914/

25

4

0

文章推荐： c++ - 如何优化[C++]？

文章推荐： sql - 优化多列 LIKE SQL 查询的一些最佳实践是什么？

文章推荐： optimization - 什么是好的、免费的 SSA/SCCP 资源？

html - Z 索引 - 滑动过渡重叠有没有办法创建动态 z 索引？
这几天我一直在努力。我一直在自学 CSS，所以对菜鸟好一点。我正在创建一个推荐 slider 。推荐以 3 个 block 显示。我希望前 2 个下降，第 3 个上升。但是当 slider 激活时，无
node.js - 索引.ejs VS 索引.html
我最近开始学习 Nodejs，现在我很困惑我的网络应用程序使用什么，html 还是 ejs (Express)。 Ejs 使用 Express 模块，而 .html 使用 HTML 模块。我的第一个问
sql - 跨两列/数组的 PostgreSQL 搜索/索引(GIN 索引？)
假设我们有一个 PostgreSQL 表contacts，每条记录都有一堆带标签的电子邮件地址(标签和电子邮件对)——其中一个是“主要”。存储方式如下: id 主键电子邮件文本 email_la
Tesseract 索引 >= 0 && 索引 < size_used_ :Error:Assert failed Error
我成功为一种新的tesseract语言编写了traineddata文件，但是当我完成时，我继续收到以下错误: index >= 0 && index = 0 && 索引 < size_used_ :E
python - .loc[索引, 列] 和 .loc[索引][列] 之间有什么区别？
这个问题已经有答案了: How to deal with SettingWithCopyWarning in Pandas (21 个回答) 已关闭 4 年前。假设我有一个像这样的数据框，第一列“密
Android - 从位置 A(索引)检查位置 B(索引)是否在 GridView 布局中与它成对角线，而不管是否接近
如果我有一个位置或行/列同时用于 A 和 B 位置，请检查 B 是否与 A 成对角线？ 1 2 3 4 5 6 7 8 9 例如，我如何检查 5 是否与 7 成对角线？此外，如果我检查 4 是
MongoDB：索引
MongoDB：索引一、创建索引默认情况下，集合中的_id字段就是索引，我们可以通过getIndexes()方法来查看一个集合中的索引 > db.user.getIndexes() [ { "v
MongoDB——索引
一、索引介绍索引是一种用来快速查询数据的数据结构。 B+Tree就是一种常用的数据库索引数据结构，MongoDB采用B+Tree 做索引，索引创建在colletions上。 MongoDB不使用索引
SQLite 索引
我无法决定索引。就像我有下面的查询需要太多时间来执行: select count(rn.NODE_ID) as Count, rnl.[ISO_COUNTRY_CODE] as Cou
MySQL查询优化——索引
我有这些表: CREATE TABLE `cstat` ( `id_cstat` bigint(20) NOT NULL, `lang_code` varchar(3) NOT NULL,
mysql表性能升级(索引
我正在尝试找到一种方法来提高包含 IP 范围的 mysql 表的性能(在高峰时段每秒最多有 500 个 SELECT 查询(!)，所以我有点担心)。我有一个这种结构的表: id smallint(
jquery 索引()
jquery index() 似乎无法识别元素之一，总是说“无法读取未定义的属性‘长度’”这是我的代码。mnumber 是导致问题的原因。我需要 number 和 mnumber 才能跟踪使用鼠标，并
MongoDB 索引
我们有一个包含近 4000 万条记录的 MongoDB 集合。该集合的当前大小为 5GB。此集合中存储的数据包含以下字段: _id: "MongoDB id" userid: "user id" (i
MongoDB 索引
文档说:如果你有多个字段的复合索引，你可以用它来查询字段的开始子集。所以如果你有一个索引一个，乙，丙你可以用它查询一种一个，乙a,b,c 我的问题是，如果我有一个像这样的复合索引一个，乙，丙我可以查询
jQuery .each() 索引？
我正在使用 $('#list option').each(function(){ //do stuff }); 循环列表中的选项。我想知道如何获取当前循环的索引？因为我不想让 var i = 0;循
快速了解MySQL 索引
MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。打个比方，如果合理的设计且使用索引的MySQL是一辆兰博基尼的话，那么没有设计和使用索引的MySQL
18、SQLite 索引
SQLite 索引（Index）索引（Index）是一种特殊的查找表，数据库搜索引擎用来加快数据检索。简单地说，索引是一个指向表中数据的指针。一个数据库中的索引与一本书后边的索引是非常相似的。
RavenDB MultiMap 索引
我是 RavenDB 的新手。我正在尝试使用多 map 索引功能，但我不确定这是否是解决我的问题的最佳方法。所以我有三个文件:Unit、Car、People。汽车文件看起来像这样: { Id: "
基于标准的 Excel 索引
我有以下数据，我想根据范围在另一个表中建立索引我想要实现的是，例如，如果三星的销售额为 2500，则折扣为 2%，低于 3000 且高于 1000 我知道它可以通过索引来完成，与多个数组匹配，然后指
SQL 索引 - 这是重叠的吗？
我正在检查并删除 SQL 数据库中的重复和冗余索引。所以如果我有两个相同的索引，我会删除。例如，如果我删除了重叠的索引... 索引1:品牌、型号指标二:品牌、型号、价格我删除索引 1。相同顺

首页

博学

6Ren·AI

商城

sql - "ORDER BY"当结果集很大并且不能按索引排序时优化