postgresql - 使用 LIMIT..OFFSET 时使用奇怪的 PostgreSQL 索引-6ren

postgresql - 使用 LIMIT..OFFSET 时使用奇怪的 PostgreSQL 索引

转载作者：行者123 更新时间：2023-11-29 12:39:47

24

4

x86_64-pc-linux-gnu 上的 PostgreSQL 9.6.3，由 gcc (Debian 4.9.2-10) 4.9.2，64 位编译

表格和索引:

create table if not exists orders
(
    id bigserial not null constraint orders_pkey primary key,
    partner_id integer,
    order_id varchar,
    date_created date,
    state_code integer,
    state_date timestamp,
    recipient varchar,
    phone varchar,
);

create index if not exists orders_partner_id_index on orders (partner_id);
create index if not exists orders_order_id_index on orders (order_id);
create index if not exists orders_partner_id_date_created_index on orders (partner_id, date_created);

任务是创建分页/排序/过滤数据。

第一页的查询:

select order_id, date_created, recipient, phone, state_code, state_date
from orders
where partner_id=1 and date_created between '2019-04-01' and '2019-04-30'
order by order_id asc limit 10 offset 0;

查询计划:

QUERY PLAN
"Limit  (cost=19495.48..38990.41 rows=10 width=91)"
"  ->  Index Scan using orders_order_id_index on orders  (cost=0.56..**41186925.66** rows=21127 width=91)"
"        Filter: ((date_created >= '2019-04-01'::date) AND (date_created <= '2019-04-30'::date) AND (partner_id = 1))"

没有使用索引orders_partner_id_date_created_index，所以成本极高!

但是从一些偏移值开始(确切的值不时不同，看起来它取决于总行数)索引开始被使用:

select order_id, date_created, recipient, phone, state_code, state_date
from orders
where partner_id=1 and date_created between '2019-04-01' and '2019-04-30'
order by order_id asc limit 10 offset 40;

计划:

QUERY PLAN
"Limit  (cost=81449.76..81449.79 rows=10 width=91)"
"  ->  Sort  (cost=81449.66..81502.48 rows=21127 width=91)"
"        Sort Key: order_id"
"        ->  Bitmap Heap Scan on orders  (cost=4241.93..80747.84 rows=21127 width=91)"
"              Recheck Cond: ((partner_id = 1) AND (date_created >= '2019-04-01'::date) AND (date_created <= '2019-04-30'::date))"
"              ->  Bitmap Index Scan on orders_partner_id_date_created_index  (cost=0.00..4236.65 rows=21127 width=0)"
"                    Index Cond: ((partner_id = 1) AND (date_created >= '2019-04-01'::date) AND (date_created <= '2019-04-30'::date))"

这是怎么回事？这是强制服务器使用索引的方法吗？

最佳答案

一般答案:

Postgres 存储一些关于你的表的信息
在执行查询之前，规划器根据这些信息准备执行计划
在您的情况下，计划者认为对于某些偏移值，此次优计划会更好。请注意，您想要的计划需要按 order_id 对所有选定的行进行排序，而这个“更差”的计划则不需要。我猜想 Postgres 打赌会有很多这样的行用于各种订单，并且只是从最低开始测试一个接一个的订单。

我可以想到两种解决方案:

A) 通过运行为刨床提供更多数据

ANALYZE orders;

( https://www.postgresql.org/docs/9.6/sql-analyze.html )

或者改变收集的统计数据

ALTER TABLE orders SET STATISTCS (...);

( https://www.postgresql.org/docs/9.6/planner-stats.html )

B) 以提示所需索引使用的方式重写查询，如下所示:

WITH
partner_date (partner_id, date_created) AS (
    SELECT  1,
            generate_series('2019-04-01'::date, '2019-04-30'::date, '1 day'::interval)::date
)
SELECT o.order_id, o.date_created, o.recipient, o.phone, o.state_code, o.state_date
FROM   orders o
JOIN   partner_date pd
    ON (o.partner_id, o.date_created) = (pd.partner_id, pd.date_created)
ORDER BY order_id ASC LIMIT 10 OFFSET 0;

或者甚至更好:

WITH
partner_date (partner_id, date_created) AS (
    SELECT  1,
            generate_series('2019-04-01'::date, '2019-04-30'::date, '1 day'::interval)::date
), 
all_data AS (
    SELECT o.order_id, o.date_created, o.recipient, o.phone, o.state_code, o.state_date
    FROM   orders o
    JOIN   partner_date pd
        ON (o.partner_id, o.date_created) = (pd.partner_id, pd.date_created)
)
SELECT *
FROM   all_data
ORDER BY order_id ASC LIMIT 10 OFFSET 0;

免责声明 - 我无法解释为什么第一个查询应该由 Postgres 规划器以其他方式解释，只是认为它可以。另一方面，第二个查询将偏移量/限制与连接分开，如果 Postgres 仍然以“坏”(根据您的基准)方式进行操作，我会感到非常惊讶。

关于postgresql - 使用 LIMIT..OFFSET 时使用奇怪的 PostgreSQL 索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56476305/

24

4

0

文章推荐： php - 使用 PHP 和 MySQL 的 Android 注册表单

文章推荐： MySQL - 我可以避免这些相关/依赖子查询吗？

文章推荐： sql - 在全局表中存储 WHERE 子句

mysql - 他们说不要使用 OFFSET，但 OFFSET 的实际目的是什么？
看来 OFFSET由于性能低下，不建议在处理大记录时使用类似 WHERE id < x LIMIT y 的东西. 如果是这种情况，为什么 OFFSET 存在，它还有其他用途吗？最佳答案从概念上讲，
assembly - assembly jmp offset 是什么意思？
我用过 objdump -M intel -d test 和 objdump -d test 使用 gcc 686-elf 交叉编译器反汇编一个非常简单的 for 循环。在这两种情况下，我都会得到以下
java - 如何避免连续出现 "Resetting offset"和 "Seeking to LATEST offset"？
我正在尝试遵循本指南: https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html但我不明白为什么
java - 如何避免连续出现 "Resetting offset"和 "Seeking to LATEST offset"？
我正在尝试遵循本指南: https://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html但我不明白为什么
mysql - SQL 分页尝试 : OFFSET (offset) is not a valid input at this position
这个问题已经有答案了: MySQL Data - Best way to implement paging? (9 个回答) 已关闭 3 年前。我是 SQL 世界的新手。现在，我有以下查询: SE
python - 类型错误 : can't compare offset-naive and offset-aware datetimes
托管我的db 的服务器位于美国。当我向 db 添加项目时，我希望使用 Australia/Sydney 时间存储时间。无论用户在哪个国家/地区，如果他们检索此记录，都应使用 Australia/Syd
offset - H2 inside div inline-block weird offset
我有一个周边其中也有一些图像，和一段文字。都是inline-block .每当 H2 延伸到两行时，下一个是抵消。以下是屏幕截图。 HTML:
javascript - Moment.Js : Offsetting dates using UTC and Timezone offset
我正在尝试使用时区偏移量和 UTC 时间戳来调整时间。我正在运行以下代码: var date = { utc: '2013-10-16T21:31:51', offset: -480
javascript - 用 angular.element(element).offset 替换 $(element).offset
我不应该在我的应用程序中使用 jQuery，但我有一个场景，我需要元素的偏移量，而不是使用 $(element).offset() 我已经使用了 angular.element(element).of
MySQL ORDER BY + LIMIT + OFFSET 语句 : how to OFFSET firts and only then sort with ORDER BY
我有一个包含 ID、NAME、PRICE 和 DATE 列的表。我正在尝试编写一个分页式导航，因为表中有很多条目，所以查看整个 SELECT 的输出变得不舒服。我写了以下请求: SELECT id
c# - Max(Threading.Interlocked.Increment(Offset), Offset - 1) 有什么意义？
我现在已经多次看到提到的这段代码，执行 Max(a+1, a-1) 有什么意义？一开始我以为可能是为了防止下溢，但是在那种情况下不防止下溢真的没有意义。最佳答案谷歌搜索让我怀疑这可能是由某些(可能
c# - 日期时间偏移错误 : UTC offset of local dateTime does not match the offset argument
我正在尝试创建一种将时间从一个时区转换为另一个时区的小方法。我认为这很简单，但是当我部署它时我得到了这个错误 The UTC Offset of the local dateTime paramete
sql-server - OFFSET 和 FETCH 对查询造成巨大的性能影响——包括当 OFFSET = 0 时
我有一个相当复杂的 SQL 查询，涉及从大量连接返回大约 20 列，用于在 UI 中填充结果网格。它还使用几个 CTE 来预过滤结果。我在下面包含了查询的近似值(我已经注释掉了修复性能的行) 随着数据
python-2.7 - 类型错误 : can't subtract offset-naive and offset-aware datetimes
所以我试图减去 datetime 对象。我使用 dateutil.parser 获得了一个，另一个来自 datetime.now()。我不断得到一个 TypeError: can't subtract
python-2.7 - 类型错误 : can't subtract offset-naive and offset-aware datetimes
所以我试图减去 datetime 对象。我使用 dateutil.parser 获得了一个，另一个来自 datetime.now()。我不断得到一个 TypeError: can't subtract
python - Pandas 过滤器日期时间 : TypeError: can't compare offset-naive and offset-aware datetimes
我有一个 Pandas 数据框: name my_timestamp ------------------------------------------ 0 a1 201
css - Bootstrap 4 接受 offset-md-*，而不是 col-offset-md-* 命名约定错误
我只是 Bootstrap 4 的初学者。我最近才开始学习它，很遗憾，我已经遇到了问题。我修改了 Bootstrap 4 手册本身的一些代码。然而，它惨遭失败，偏移量无法正常工作。代码非常简单，但不
R线性回归问题: lm. fit(x, y, offset = offset, Single.ok = Single.ok, ...)
我尝试使用 R 进行回归。我有以下代码，导入 CSV 文件没有问题 dat <- read.csv('http://pastebin.com/raw.php?i=EWsLjKNN',sep="
php - 如何解决此错误 : (Warning: Illegal string offset) and (Notice: Uninitialized string offset: 0)
假设我有 search.php 和 edit.php。在 search.php 中，他们可以删除和更新一些记录。如果用户单击“更新”按钮，系统会将用户重定向到另一个名为 edit.php 的页面。我成
c# - 设置 SmartNavigation=True 会导致 javascript offset.Width/offset.Height 出错
我正在使用流行的 css hack 在 Internet Explorer 8 中启用边框半径，可在此处找到:( Curved-corner-border-radius-cross-browser)。

首页

博学

6Ren·AI

商城

postgresql - 使用 LIMIT..OFFSET 时使用奇怪的 PostgreSQL 索引