sql - 如何尽可能透明地将现有的 Postgres 表迁移到分区表？-6ren

sql - 如何尽可能透明地将现有的 Postgres 表迁移到分区表？

转载作者：行者123 更新时间：2023-11-29 11:26:56

24

4

我在 postgres-DB 中有一个现有表。为了演示，这是它的样子:

create table myTable(
    forDate date not null,
    key2 int not null,
    value int not null,
    primary key (forDate, key2)
);

insert into myTable (forDate, key2, value) values
    ('2000-01-01', 1, 1),
    ('2000-01-01', 2, 1),
    ('2000-01-15', 1, 3),
    ('2000-03-02', 1, 19),
    ('2000-03-30', 15, 8),
    ('2011-12-15', 1, 11);

然而与这几个值相比，myTable 实际上是巨大的，而且它还在不断增长。我正在从这个表中生成各种报告，但目前我的报告中有 98% 是在一个月内工作的，而其余的查询在更短的时间范围内工作。通常我的查询导致 Postgres 对这个巨大的表进行表扫描，我正在寻找减少问题的方法。 Table partitioning似乎很适合我的问题。我可以把我的表分成几个月。但是如何将现有表变成分区表呢？手册明确指出:

It is not possible to turn a regular table into a partitioned table or vice versa

所以我需要开发自己的迁移脚本，它会分析当前表并进行迁移。需求如下:

在设计时，myTable 涵盖的时间范围是未知的。
每个分区应涵盖从该月的第一天到该月的最后一天的一个月。
表格会无限增长，所以对于要生成多少表格，我没有理智的“停止值”
结果应该尽可能透明，这意味着我想尽可能少地接触现有代码。在最好的情况下，这就像一个普通的表格，我可以在其中插入和选择而无需任何特殊选项。
数据库迁移停机时间是可以接受的
最好使用纯 Postgres，无需在服务器上安装任何插件或其他东西。
数据库是 PostgreSQL 10，升级到新版本迟早会发生，所以如果有帮助，这是一个选择

如何迁移要分区的表？

最佳答案

在 Postgres 10 中引入了“声明式分区”，它可以减轻您的大量工作，例如使用大量 if/else 语句重定向到正确的表来生成触发器或规则。 Postgres 现在可以自动执行此操作。让我们从迁移开始:

重命名旧表并创建新的分区表

alter table myTable rename to myTable_old;

create table myTable_master(
    forDate date not null,
    key2 int not null,
    value int not null
) partition by range (forDate);

这几乎不需要任何解释。旧表被重命名(数据迁移后我们将删除它)并且我们得到一个分区的主表，它与我们的原始表基本相同，但没有索引)

创建一个可以根据需要生成新分区的函数:

create function createPartitionIfNotExists(forDate date) returns void
as $body$
declare monthStart date := date_trunc('month', forDate);
    declare monthEndExclusive date := monthStart + interval '1 month';
    -- We infer the name of the table from the date that it should contain
    -- E.g. a date in June 2005 should be int the table mytable_200506:
    declare tableName text := 'mytable_' || to_char(forDate, 'YYYYmm');
begin
    -- Check if the table we need for the supplied date exists.
    -- If it does not exist...:
    if to_regclass(tableName) is null then
        -- Generate a new table that acts as a partition for mytable:
        execute format('create table %I partition of myTable_master for values from (%L) to (%L)', tableName, monthStart, monthEndExclusive);
        -- Unfortunatelly Postgres forces us to define index for each table individually:
        execute format('create unique index on %I (forDate, key2)', tableName);
    end if;
end;
$body$ language plpgsql;

这个以后会派上用场的。

创建一个基本上只委托(delegate)给我们的主表的 View :
```
create or replace view myTable as select * from myTable_master;
```

创建规则，这样当我们插入规则时，我们不仅会更新分区表，还会在需要时创建一个新分区:

create or replace rule autoCall_createPartitionIfNotExists as on insert
    to myTable
    do instead (
        select createPartitionIfNotExists(NEW.forDate);
        insert into myTable_master (forDate, key2, value) values (NEW.forDate, NEW.key2, NEW.value)
    );

当然，如果您还需要update 和delete，您还需要一个规则来处理那些应该是直截了当的规则。

实际迁移旧表:

-- Finally copy the data to our new partitioned table
insert into myTable (forDate, key2, value) select * from myTable_old;

-- And get rid of the old table
drop table myTable_old;

现在表的迁移已经完成，不需要知道需要多少分区，而且 View myTable 将是绝对透明的。您可以像以前一样从该表中简单地插入和选择，但您可能会从分区中获得性能优势。

请注意， View 是唯一需要的，因为分区表不能有行触发器。如果您可以在代码需要时手动调用 createPartitionIfNotExists，那么您就不需要 View 及其所有规则。在这种情况下，您需要在迁移过程中手动添加分区:

do
$$
declare rec record;
begin
    -- Loop through all months that exist so far...
    for rec in select distinct date_trunc('month', forDate)::date yearmonth from myTable_old loop
        -- ... and create a partition for them
        perform createPartitionIfNotExists(rec.yearmonth);
    end loop;
end
$$;

关于sql - 如何尽可能透明地将现有的 Postgres 表迁移到分区表？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53600144/

24

4

0

文章推荐： php - 将带有 MySQL 数据库的 PHP 程序转换为 .exe 文件

文章推荐： postgresql - 什么是最适合 postgresql 10.5 的 hibernate.dialect？

文章推荐： nhibernate - 如何从 NHibernate 映射文件生成 "migration"DDL？

r - 现有 R 图中的子图
我有一个如下图所示的情节。对于这个情节，我想在情节(右下角或左下角)的某处添加类似的线图。我正在使用的子图的命令是 plot( 1:121, sample(1:121),type='l' ) 它绘制在
sql - 现有 SQL 数据库的规范化
我有一个单表数据库，我继承并迁移到 SQL Server，然后通过创建、链接和填充一大堆表示主表中项目的查找类型表来规范化它。我现在想用它们的外键替换原始表中的那些项目。我是不是一直在写一堆查询或 U
javascript - 在浏览器中编辑*现有* PDF
我有一个 Web 应用程序，它当前正在从服务器获取 PDF 的 base64 表示。我可以使用 Mozilla 的 pdf.js 在上显示它并使用下拉菜单切换页面。根据我所能找到的一切和Can
sql - 现有 DB2 列报告为不是表的列
在 DB2 上运行的 Moodle 2 安装中，删除用户不成功，返回从数据库读取错误: Debug info: [IBM][CLI Driver][DB2/LINUXX8664] SQL0206N "
grails - 现有 Controller 网址的HTTP状态404
我在grails项目的RH包中添加了一个名为Authorization的新域类。然后，我从grails菜单自动生成了 Controller 和 View 。但是当我尝试输入 Controller
plunker - 现有 Plunker 的副本
今天，我发现了一个有趣的plunker，经过谷歌大量搜索后一无所获，希望我能在这里找到答案。我只是想要那个笨蛋的副本。我不想使用复制和粘贴技术。有什么方法可以获取已建立的 plunk 的副本吗？我如何
ios - 现有 sqlite 数据库的核心数据
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: Migrate normal sqlite3 database to core data? 是否可以将现有的 sql
java - 现有 list (构建错误)
我正在尝试在我的应用程序上添加启动画面。我干净地构建了程序，但我选择了错误的文件。现在我第二次编辑了 VM 选项并再次干净构建，现在我收到此错误: C:\Users\User\Documents\Ne
ios - 现有 CollectionView 图像在滚动时发生变化
我已经查看了很多问题，我不相信这是重复使用单元格的结果，因为新的单元格图像是正确的，但是现有的单元格图像不正确并且曾经是正确的。我会先发布图片，以便更容易理解问题。我有一个图像单元的 Collect
java - 现有 key 的哈希表为空
我在来自 Vaadin 的 ContainerHierarchicalWrapper 的这段代码中有一个非常奇怪的错误: for (Object object : children.keySet())
javascript - 现有 JavaScript 应用程序的国际化和本地化
到目前为止，我正在使用 Globalize用于我的 JavaScript 应用程序的 i18n 和 l10n(使用 jQuery UI 构建)。这行得通，但它将我的代码与另一个特定的库联系在一起。现在
现有 JHipster 项目中的 Elasticsearch
我正在创建一个 JHipster 应用程序，现在确定了 full text search 的必要性.我知道 JHipster 与 Elasticseach 集成，但我在创建项目时没有启用它。有没有一种
mysql - 现有 mysql 表或单独表中的附加字段
我一直在寻找堆栈中的建议，但我仍然不能 100% 确定改进它的最佳方法。我有一个存储大约 130K 条记录的 mysql INNODB“产品”表。杂项产品数据等大约有 80 个字段，然后我们一直在为每
c++ - 使用另一个(现有)对象创建新对象时会发生什么？
我在一本书上看到，它说:当我们使用另一个初始化新创建的对象时 - 使用复制构造函数创建一个临时对象，然后使用赋值运算符将值复制到新对象! 后来在书中我读到:当使用另一个对象初始化新对象时，编译器创建一
python - 现有 Django 项目中的语法错误
我第一次安装现有的 Django 项目时遇到了启动服务器 python manage.py runserver 的问题这是我做的 1.克隆仓库， 2.制作虚拟环境 3.pip安装要求.txt 4.生
html - 现有 linux 用户登录网站
我有一个网站，还有一个登录表单。我不想使用 PHP 来检查我的 MySQL 数据库，因此我正在寻找一种方法来检查用户凭据以查看是否已有 Linux 用户。我知道 PAM，但我还没有找到任何有关如何从网
c# - 现有 Umbraco 项目的开发
我有一个现有的 Umbraco 项目在 IIS 服务器上运行。当我开始这个项目时，我基本上是将 Umbraco 直接安装到服务器上，并通过管理界面进行编码，直到网站启动并上线。现在，客户想要一些更改
android - 现有 Android 虚拟设备列表为空
我是 Android 开发新手，目前正在学习一些教程。当我在 Eclipse 中设置一个新的 Android 项目，并选择 Windows -> Android SDK and AVD Manager
java - 有效(现有)电子邮件地址验证
我有这个注册页面可以正常工作，但对于电子邮件字段，我需要确保电子邮件正确有效1:正确2 : 有效为了正确添加电子邮件，我正在使用 Java 脚本验证来维护abc@def.com 很好用但我的问题是
c# - 现有 COM 引用或添加新引用时出错
首先让我说我不熟悉 COM 引用，并且我在 Windows 7 64 位计算机上使用 VS2010。今天早上，我从 TFS 中删除了一个现有项目。然后我尝试构建项目并收到此错误: The type o

首页

博学

6Ren·AI

商城

sql - 如何尽可能透明地将现有的 Postgres 表迁移到分区表？