gpt4 book ai didi

sql - 关于PostgreSQL性能的两个问题

转载 作者:行者123 更新时间:2023-11-29 13:34:40 27 4
gpt4 key购买 nike

1) 在 PostgreSQL 中实现分页的最佳方式是什么?

假设我们需要实现分页。最简单的查询是 select * from MY_TABLE order by date_field DESC limit 10 offset 20据我所知,我们这里有 2 个问题:如果日期可能有重复值,每次运行此查询都可能返回不同的结果,并且偏移值越大,查询运行的时间就越长。我们必须提供额外的列,即 date_field_index:

--date_field--date_field_index--
12-01-2012 1
12-01-2012 2
14-01-2012 1
16-01-2012 1
--------------------------------

现在我们可以这样写

create index MY_INDEX on MY_TABLE (date_field, date_field_index);
select * from MY_TABLE where date_field=<last_page_date and not (date_field_index>=last_page_date_index and date_field=last+page_date) order by date_field DESC, date_field_index DESC limit 20;

..因此使用 where 子句和相应的索引而不是偏移量。好的,现在是问题:

1) 这是改进初始查询的最佳方法吗?2) 我们如何填充 date_field_index 字段?我们必须为此提供一些触发条件吗?3) 我们不应该在 Postgres 中使用 RowNumber() 函数,因为它们不使用索引,因此非常慢。是否正确?

2) 为什么连接索引中的列顺序不影响查询的性能?

我的测量表明,在使用连接索引(由 2 个或更多列组成的索引)进行搜索时,如果我们将最具选择性的列放在首位或将其放在末尾,则没有区别。为什么?如果我们将最有选择性的列放在首位 - 我们会遍历较短范围的已找到行,这应该会对性能产生影响。我说得对吗?

最佳答案

使用主键解开而不是date_field_index列。否则解释为什么这不是一个选项。

order by date_field DESC, "primary_key_column(s)" DESC

具有最唯一列的组合索引性能最好,但在以下情况下不会使用:

  • 不同的值超过表格的百分之几
  • 没有足够的行使其值得
  • 日期范围不够小

explain my_query 的输出是什么?

关于sql - 关于PostgreSQL性能的两个问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15766507/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com