postgresql - Postgres 分区表 - 转换为声明分区-6ren

postgresql - Postgres 分区表 - 转换为声明分区

转载作者：行者123 更新时间：2023-11-29 13:39:00

对于冗长的帖子，我深表歉意。我试图了解所有细节。

我们最近将 Postgres AWS RDS 从 9.5 升级到了 11.1。

我们有几个使用继承实现的大型分区表，我们正在考虑将其转换为声明式分区。(我说的是 5TB 的分区数据)。在我推进之前，我想确定我的方法。

例如，这里是我们如何创建具有继承性的分区表。该表有一个主键和一个索引。继承的分区有一个检查约束和一个索引。 (未显示的是将新行放入正确分区的主表上的触发器。)

CREATE TABLE test
(
    date_key numeric(15,0) NOT NULL,
    metric numeric(15,0) NOT NULL,
    value numeric(28,5) NOT NULL,
    CONSTRAINT test_pkey PRIMARY KEY (date_key,metric)
)
TABLESPACE pg_default;

CREATE INDEX test_idx1
    ON test USING btree
    (metric)
    TABLESPACE pg_default;

CREATE TABLE test_201908
(
    CONSTRAINT const_test_chk CHECK (date_key >= 20190801::numeric AND date_key <= 20190831::numeric)
)
    INHERITS (test)
TABLESPACE pg_default;

CREATE INDEX test_idx1_201908
    ON test_201908 USING btree
    (metric)
    TABLESPACE pg_default;

AMZGQ3DW=> \d+ edibben.test
                                       Table "edibben.test"
  Column  |     Type      | Collation | Nullable | Default | Storage | Stats target | Description
----------+---------------+-----------+----------+---------+---------+--------------+-------------
 date_key | numeric(15,0) |           | not null |         | main    |              |
 metric   | numeric(15,0) |           | not null |         | main    |              |
 value    | numeric(28,5) |           | not null |         | main    |              |
Indexes:
    "test_pkey" PRIMARY KEY, btree (date_key, metric)
    "test_idx1" btree (metric)
Child tables: edibben.test_201908


AMZGQ3DW=> \d+ edibben.test_201908
                                   Table "edibben.test_201908"
  Column  |     Type      | Collation | Nullable | Default | Storage | Stats target | Description
----------+---------------+-----------+----------+---------+---------+--------------+-------------
 date_key | numeric(15,0) |           | not null |         | main    |              |
 metric   | numeric(15,0) |           | not null |         | main    |              |
 value    | numeric(28,5) |           | not null |         | main    |              |
Indexes:
    "test_idx1_201908" btree (metric)
Check constraints:
    "const_test_chk" CHECK (date_key >= 20190801::numeric AND date_key <= 20190831::numeric)
Inherits: edibben.test

我知道我可以通过执行以下操作将此表转换为声明性分区表:

创建一个新的分区表:

CREATE TABLE test_part
(
    date_key numeric(15,0) NOT NULL,
    metric numeric(15,0) NOT NULL,
    value numeric(28,5) NOT NULL,
    CONSTRAINT test_part_pkey PRIMARY KEY (date_key,metric)
) PARTITION BY RANGE (date_key)
TABLESPACE pg_default;

CREATE INDEX test_part_idx1
    ON test_part USING btree
    (metric)
    TABLESPACE pg_default;

删除 test_201908 表上的继承:

alter table test_201908 no inherit test;

然后将这张表添加到分区表中。 doco 表示在加载数据之前保持检查约束。

alter table test_part
attach partition test_201908
for VALUES FROM (20190801) TO (20190831);

分区显示为附加到表:

\d+ edibben.test_part
                                    Table "edibben.test_part"
  Column  |     Type      | Collation | Nullable | Default | Storage | Stats target | Description
----------+---------------+-----------+----------+---------+---------+--------------+-------------
 date_key | numeric(15,0) |           | not null |         | main    |              |
 metric   | numeric(15,0) |           | not null |         | main    |              |
 value    | numeric(28,5) |           | not null |         | main    |              |
Partition key: RANGE (date_key)
Indexes:
    "test_part_pkey" PRIMARY KEY, btree (date_key, metric)
    "test_part_idx1" btree (metric)
Partitions: edibben.test_201908 FOR VALUES FROM ('20190801') TO ('20190831')

我的问题是关于索引发生了什么。当您检查分区时，您会看到从分区表继承的主键和原始索引 (test_idx1_201908)。

AMZGQ3DW-> \d+ edibben.test_201908
                                   Table "edibben.test_201908"
  Column  |     Type      | Collation | Nullable | Default | Storage | Stats target | Description
----------+---------------+-----------+----------+---------+---------+--------------+-------------
 date_key | numeric(15,0) |           | not null |         | main    |              |
 metric   | numeric(15,0) |           | not null |         | main    |              |
 value    | numeric(28,5) |           | not null |         | main    |              |
Partition of: edibben.test_part FOR VALUES FROM ('20190801') TO ('20190831')
Partition constraint: ((date_key IS NOT NULL) AND (date_key >= '20190801'::numeric(15,0)) AND (date_key < '20190831'::numeric(15,0)))
Indexes:
    "test_201908_pkey" PRIMARY KEY, btree (date_key, metric)
    "test_idx1_201908" btree (metric)
Check constraints:
    "const_test_chk" CHECK (date_key >= 20190801::numeric AND date_key <= 20190831::numeric)

如果我向 test_part 表添加一个新分区

CREATE TABLE test_201909 PARTITION OF test_part
    FOR VALUES FROM ('20190901') TO ('20190930');

新表有主键和索引，但索引有一个系统生成的名称。

$\d+ edibben.test_201909
                                   Table "edibben.test_201909"
  Column  |     Type      | Collation | Nullable | Default | Storage | Stats target | Description
----------+---------------+-----------+----------+---------+---------+--------------+-------------
 date_key | numeric(15,0) |           | not null |         | main    |              |
 metric   | numeric(15,0) |           | not null |         | main    |              |
 value    | numeric(28,5) |           | not null |         | main    |              |
Partition of: edibben.test_part FOR VALUES FROM ('20190901') TO ('20190930')
Partition constraint: ((date_key IS NOT NULL) AND (date_key >= '20190901'::numeric(15,0)) AND (date_key < '20190930'::numeric(15,0)))
Indexes:
    "test_201909_pkey" PRIMARY KEY, btree (date_key, metric)
    "test_201909_metric_idx" btree (metric)

查看我刚刚创建的对象的 pg_class:

AMZGQ3DW=> select relname, reltype, relkind,relowner from pg_class where relname like 'test%';
        relname         | reltype | relkind | relowner
------------------------+---------+---------+----------
 test_201908            |  365444 | r       |    98603
 test_201908_pkey       |       0 | i       |    98603
 test_idx1_201908       |       0 | i       |    98603

 test_201909            |  366498 | r       |    98603
 test_201909_metric_idx |       0 | i       |    98603
 test_201909_pkey       |       0 | i       |    98603

 test_part              |  365449 | p       |    98603
 test_part_idx1         |       0 | I       |    98603
 test_part_pkey         |       0 | I       |    98603

分区表上的索引有一个 relkind 为 I，分区上的索引有一个 relkind 为 i。查看 pg_indexes主表上没有索引条目:

AMZGQ3DW=> select schemaname, tablename, indexname from pg_indexes where schemaname = 'edibben' and tablename = 'test_part';
 schemaname | tablename | indexname
------------+-----------+-----------
(0 rows)

分区上的索引确实显示了:

AMZGQ3DW=> select schemaname, tablename, indexname from pg_indexes where schemaname = 'edibben' and tablename like 'test%' order by tablename;
 schemaname |  tablename  |       indexname
------------+-------------+------------------------
 edibben    | test_201908 | test_201908_pkey
 edibben    | test_201908 | test_idx1_201908
 edibben    | test_201909 | test_201909_pkey
 edibben    | test_201909 | test_201909_metric_idx

那么，这个分区表的索引是否正确？ (是的，这个困惑中埋藏着一个问题)。我找不到任何关于如何分区索引有效，但分区“索引”似乎只是一个定义，真正的索引在分区本身上。有没有办法列出与分区索引关联的所有索引？有没有办法查看分区索引是否有效？

此外，doco 还讨论了使用 CREATE INDEX ON ONLY 选项在分区表上创建索引。我不认为这个适用于我需要做的事情。我说得对吗？

“如上所述，可以在分区表上创建索引并自动应用它们到整个层次结构。这非常方便，因为不仅现有分区会被索引，但将来创建的任何分区也会。一个限制是无法使用创建此类分区索引时的 CONCURRENTLY 限定符。为了克服长时间的锁定，可以仅在分区表上使用 CREATE INDEX；这样的索引被标记为无效，并且分区不会自动应用索引。可以创建分区索引分别使用 CONCURRENTLY，然后使用 ALTER INDEX .. ATTACH PARTITION 附加到父级上的索引。一旦所有分区的索引都附加到父索引，父索引将自动标记为有效。”

最佳答案

索引 test_idx1_201908 自动转换为分区索引 test_201909_metric_idx 的一个分区。它的名称与其他索引分区不同并不重要。

您可以使用以下查询来验证:

SELECT relispartition FROM pg_class WHERE relname = 'test_idx1_201908';

结果应为 TRUE，表示该索引是分区索引的分区。

我有两点与您的问题无关的评论:

我注意到您没有为分区键定义范围的上限。
您指定的上限被排除，所以您应该这样写
```
CREATE TABLE test_201909 PARTITION OF test_part
    FOR VALUES FROM ('20190901') TO ('20191001');
```
这可能为时已晚，但您应该为分区列选择 date 而不是 numeric。
这将使一切变得更简单、更易读，并且不可能输入错误的日期，例如 20190335。

关于postgresql - Postgres 分区表 - 转换为声明分区，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58218823/

文章推荐： python - postgreSQL 中已定义模式的 PonyORM 多对多关系

文章推荐： php - 在 PHP 函数中传递变量

文章推荐： mysql - SQL查询多表连接信息

文章推荐： postgresql 重复键违反唯一约束

Neo4j 分区
是一种在 Neo4j 分区之间进行物理分离的方法吗？这意味着以下查询将转到 node1: Match (a:User:Facebook) 虽然此查询将转到另一个节点(可能托管在 docker 上)
非企业服务器上的 SQL 分区？
我尝试在我的 SQL 服务器上使用分区函数对我的一个大表进行分区，但我收到一条错误消息 “只能在SQL Server企业版中创建分区功能。只有SQL Server企业版支持分区。” 所以我想知道没有企
hadoop - hadoop中的文件拆分/分区
在hadoop文件系统中，我有两个文件，分别是X和Y。通常，hadoop制作的文件X和Y的大小为64 MB。是否可以强制hadoop划分两个文件，以便从X的32 MB和Y的32 MB中创建一个64 M
组合键的 Cassandra 分区
据我了解，如果我们有一个主键，则使用该键对数据进行分区并将其存储在节点中(例如使用随机分区器)。现在我不确定的是，如果我有多个键(又名复合键)，是用于分区数据的键的组合还是它将是第一个主键？例如，
SSAS 分区，多少太多了
我正在向我的 SSAS 多维数据集添加分区，我想知道是否有多个分区可以保留在下面？多少太多了，最佳实践限制是 20 还是 200？有没有人可以分享任何真实世界的知识？最佳答案这是 another
MySQL 分区 - 主键和唯一记录的错误
我有一个包含大约 200 万条记录的大表，我想对其进行分区。我将 id 列设置为 PRIMARY AUTO_INCRMENT int (并且它必须始终是唯一的)。我有一列“theyear”int(4
Mysql 分区 - 如何对包含唯一列的表进行列表分区？
我正在做 mysql 列表分区。我的表数据如下 ---------------------------------------- id | unique_token | city | student_
具有大量插入和删除的表的 MySQL 分区
我有一个表，我们每天在其中插入大约 2000 万个条目(没有任何限制的盲插入)。我们有两个外键，其中一个是对包含大约 1000 万个条目的表的引用 ID。我打算删除此表中超过一个月的所有数据，因为不
真实示例中的 MySQL 分区
我想在一款足球奇幻游戏中尝试使用 MySQL Partitioning，该游戏的用户分布在联赛中，每个联赛都有一个用户可以买卖球员的市场。当很多用户同时玩时，我在这张表中遇到了一些僵局(在撰写本文时大
带有变量的 jQuery 分区
我是 jQuery 的新手，想知道是否可以获取一些变量并将它们的除法作为 CSS 宽度。到目前为止我在这里: var x = $(".some-container").length; var y =
c++ - 分区、斯特林数和第一个切比雪夫多项式的递归函数
所以我正在做家庭作业，我需要为分区、斯特林数(第一类和第二类)和第一类的切比雪夫多项式创建递归函数。我的程序应该能够让用户输入一个正整数 n，然后创建名为 Partitions.txt、Stirlin
python - 分区(如果适用)
我在数据框中有一列，其中包含大约 1,4M 行聊天对话，其中每个单元格中的一般格式为 (1): “名称代理 : 对话” 但是，并非列中的所有单元格都采用这种格式。有些单元格只是 (2): “对话” 我
html - "Collapsible"<分区>
我在尝试隐藏 a 时遇到了一些问题，直到用户单击某个元素为止。 HTML 看起来像: BRAND item 1 item 2 item 3
【kafka】-分区-消费端负载均衡
一.为什么kafka要做分区？因为当一台机器有可能扛不住（类比：就像redis集群中的redis-cluster一样，一个master抗不住写，那么就多个master去抗写）
postgresql - 分区(和拆分)值以填充槽
我有一些销售数据，我需要发送存储在单独表中的可用槽中的数量。销售数据示例: id数量112131415369 create table sales (id serial primary key, q
GlusterFS - 为什么不推荐使用 root 分区？
我计划设置多个节点以使用 glusterfs 创建分布式复制卷我使用主(也是唯一)分区上的目录在两个节点上创建了一个 gluster 复制卷。 gluster volume create vol_d
sql - 在窗口函数内过滤(通过...分区)？
我正在尝试使用 sum() over (partition by) 但在总和中过滤。我的用例是将每个产品的 12 个月累计到一个月的条目，因此: ITEM MONTH SALES Item
scala - 如何从单个枚举器中生成多个枚举器(分区、拆分、..)
是否可以创建多个 Enumerators出单Enumerator ? 我正在寻找的相当于 List.partition返回 (List[A], List[A]) ，比如 List().partitio
Yocto - 创建并填充一个单独的/home 分区
我正在创建一个基于 x86 的非常简单的 Yocto 图像。我希望/文件系统是只读的，所以我设置了 IMAGE_FEATURES_append = " read-only-rootfs " 在原件的
list - Scala 分区/收集用法
是否可以使用一次 collect 调用来创建 2 个新列表？如果没有，我该如何使用分区来做到这一点？最佳答案 collect(在TraversableLike上定义并在所有子类中可用)与集合和Par

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

postgresql - Postgres 分区表 - 转换为声明分区