postgresql - 使用 PostgreSQL MVCC 跨多个表的事务隔离

转载作者：行者123 更新时间：2023-11-29 12:18:02

25

4

问题总结

这是一个关于 SQL 事务中查询的可串行化的问题。

具体来说，我正在使用 PostgreSQL。可能假设我使用的是最新版本的 PostgreSQL。根据我的阅读，我相信用于支持我正在尝试做的事情的技术被称为“多版本并发控制”或“MVCC”。

总结一下:如果我有一个主表，以及连接到该主表的多于 1 个外键链接表，我如何保证，对于表中的给定键，以及任何数字在一个事务中使用该键的 SELECT 语句的数量，每个语句都从任何链接表中进行选择，我将获得在我开始事务时存在的数据？

其他问题

这个问题类似，但范围更广，问题和答案与 PostgreSQL 没有具体关系: Transaction isolation and reading from multiple tables on SQL Server Express and SQL Server 2005

例子

假设我有 3 个表:

bricks
    brickworks (primary key)
    completion_time (primary key)
    has_been_sold

brick_colors
    brickworks (primary key, foreign key pointing to "bricks")
    completion_time (primary key, foreign key pointing to "bricks")
    quadrant (primary key)
    color

brick_weight
    brickworks (primary key, foreign key pointing to "bricks")
    completion_time (primary key, foreign key pointing to "bricks")
    weight

砖厂一次生产一 block 砖。它制作的砖 block 在其 4 个象限中的每个象限中可能具有不同的颜色。

后来有人分析这些砖 block 以确定它们的颜色组合，并将结果写入 brick_colors 表。

其他人分析砖 block 以确定它们的重量，并将结果写入 brick_weight 表。

在任何给定时间，现有积木可能有也可能没有记录颜色，可能有也可能没有记录重量。

存在一个应用程序，并且该应用程序收到有人想要购买特定砖 block 的消息(此时应用程序已通过其 brickworks/completion_time 组合键获知)。

应用程序希望在它开始查询的那一刻选择砖 block 的所有已知属性。

如果颜色或重量信息被添加到 MID-TRANSACTION，应用程序不想知道它。

应用程序想要执行单独的查询(而不是对外键链接表进行多个 JOIN 的 SELECT，因为 brick_colors 表，这可能会返回多行)。

这个例子刻意简单；如果我的示例包括 10 个外键链接表，并且其中许多或所有表都可以为同一主键返回多行(就像 brick_colors 在我上面的例子)。

尝试的解决方案

这是我到目前为止的想法:

BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE READ ONLY ;

-- All this statement accomplishes is telling the database what rows should be returned from the present point-in-time in future queries within the transaction
SELECT DISTINCT true
FROM bricks b
LEFT JOIN brick_colors bc ON bc.brickworks = b.brickworks AND bc.completion_time = b.completion_time
LEFT JOIN brick_weight bw ON bw.brickworks = b.brickworks AND bw.completion_time = b.completion_time
WHERE b.brickworks = 'Brick-o-Matic' AND b.completion_time = '2017-02-01T07:35:00.000Z' ;

SELECT * FROM brick_colors WHERE b.brickworks = 'Brick-o-Matic' AND b.completion_time = '2017-02-01T07:35:00.000Z' ;
SELECT * FROM brick_weight WHERE b.brickworks = 'Brick-o-Matic' AND b.completion_time = '2017-02-01T07:35:00.000Z' ;

COMMIT ;

仅出于确保可序列化的目的而将第一个 SELECT 与 JOIN 一起使用似乎很浪费。

还有其他方法吗？

引用资料

PostgreSQL Concurrency Control

PostgreSQL Transcation Isolation

PostgreSQL SET TRANSACTION statement

最佳答案

这是你问题的本质:

how do I guarantee that, for ...... any number of SELECT statements ..... inside one transaction ....... I will get data as it existed at the time I started the transaction?

这正是Repeatable Read Isolation Level保证:

The Repeatable Read isolation level only sees data committed before the transaction began; it never sees either uncommitted data or changes committed during transaction execution by concurrent transactions. (However, the query does see the effects of previous updates executed within its own transaction, even though they are not yet committed.) This is a stronger guarantee than is required by the SQL standard for this isolation level, and prevents all of the phenomena described in Table 13-1. As mentioned above, this is specifically allowed by the standard, which only describes the minimum protections each isolation level must provide.

This level is different from Read Committed in that a query in a repeatable read transaction sees a snapshot as of the start of the transaction, not as of the start of the current query within the transaction. Thus, successive SELECT commands within a single transaction see the same data, i.e., they do not see changes made by other transactions that committed after their own transaction started.

一个实际的例子 - 假设我们有 2 个简单的表:

CREATE TABLE t1( x int );
INSERT INTO t1 VALUES (1),(2),(3);
CREATE TABLE t2( y int );
INSERT INTO t2 VALUES (1),(2),(3);

一些表，它们的结构，主键，外键等在这里并不重要。

让我们打开第一个 session ，启动可重复读取隔离级别，并运行两个简单且独立的 SELECT 语句:

test=# START TRANSACTION ISOLATION LEVEL REPEATABLE READ;
START TRANSACTION
test=# SELECT * FROM t1;
 x
---
 1
 2
 3
(3 wiersze)


test=# SELECT * FROM t2;
 y
---
 1
 2
 3
(3 wiersze)

请注意，START TRANSACTION 命令会自动禁用 session 中的自动提交模式。

现在在另一个 session 中(启用默认自动提交模式)将一些记录插入到t1:

test2=# INSERT INTO t1 VALUES(10),(11);

新值被插入并自动提交(因为自动提交已打开)。

现在回到第一个 session 并再次运行 SELECT:测试=#从t1中选择*；

 x
---
 1
 2
 3
(3 wiersze)

如您所见，session1(具有事件的可重复读取事务)在事务开始后看不到任何提交的更改。

让我们用表 t2 做同样的实验 - 转到第二个 session 并发出:

test2=# DELETE FROM t2 WHERE y = 2;
DELETE 1

现在回到第一个 session 并再次运行 SELECT:

test=# SELECT * FROM t2;
 y
---
 1
 2
 3
(3 wiersze)

再次如您所见，session1(具有事件的可重复读取事务)在事务开始后没有看到任何提交的更改。

现在，在 session 1 中，完成发出 COMMIT 的事务，然后选择:

test=# SELECT * FROM t1;
 x
---
 1
 2
 3
(3 wiersze)

test=# SELECT * FROM t2;
 y
---
 1
 2
 3
(3 wiersze)

test=# COMMIT;
COMMIT

test=# select * from t1;
 x
----
  1
  2
  3
 10
 11
(5 wierszy)


test=# select * from t2;
 y
---
 1
 3
(2 wiersze)

如您所见，当可重复读取事务启动并处于事件状态时，您可以多次运行许多单独的 select 语句，并且所有这些 select 语句都会看到与事务开始时相同的稳定数据快照，而不管其他 session 中提交的任何数据。

关于postgresql - 使用 PostgreSQL MVCC 跨多个表的事务隔离，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42319573/

25

4

0

文章推荐： postgresql - 使用 Ecto 交换具有唯一约束的值的正确方法？

文章推荐： mysql - 计算mysql中blob数据类型的列中具有特定单词的行数

文章推荐： c# - 如何从 Npgsql 和存储过程返回自定义表类型？

ios - 跨 Storyboard播放背景音乐。
在我的应用程序中播放背景音乐时遇到问题。首先，我在第一个 Storyboard View Controller 中的 ViewDidLoad 方法中开始播放音乐。即使我从一个页面跳转到另一个页面，它
arrays - 跨 Bigquery 数组的非重复计数
我想跨行连接数组，然后进行不同的计数。理想情况下，这会起作用: WITH test AS ( SELECT DATE('2018-01-01') as date, 2 as value,
git - 跨 repo 依赖的最佳实践
这是一个场景: Repo A 是一个包含大量模块和依赖项的怪异代码。安装起来并不容易。它由其他人维护并托管在 Github 上。 Repo A 包含一个非常有用的模块 X，并且几乎不依赖于 Repo
docker - 跨 docker 集群调度任务的最佳方法是什么？
目前，我在一台服务器上运行了一个应用程序。有一个 crontab 设置，因此根据指定的规则，在某些时间运行任务。现在，我正在考虑将我的应用程序迁移到 docker 容器中，以便我能够独立运行我的应用
lua - 跨 Lua 状态复制全局表
我有一个全局表，我想在两个不同的 Lua 状态之间保持同步。根据我所阅读和理解的内容，唯一的方法似乎是，在我的 C 后端，在状态之间进行表的深层复制(如果表已被修改)。有没有更好的办法？另外，我看
wcf - 跨 basicHttpBinding 的事务
我们目前有一个 asmx webservice，它公开了一个方法来对 Sql 数据库进行各种更新，内部包装在 SqlTransaction 中。我正在 WCF 中重写此服务，我们希望将现有方法拆分为
qt - 跨 Qt 线程共享数据
我是 Qt 的新手，所以请原谅这个问题的简单性，但我对 Qt 线程有点困惑。假设我有 3 个线程:主要的默认 GUI 线程和我自己创建的 2 个线程(称为 WorkerThread)。我的每个 Wor
django - 跨 Django 项目共享数据库
我们的产品有一个 Restful API 和一个服务器渲染的应用程序(CMS)。两者共享数据库。两者都是用django编写的两者所需的字段和模型并不是相互排斥的，有些仅针对 API，有些针对 CMS
database - 跨 4 个表的多对多关系
我正在实现一个基于角色的访问控制系统，它具有以下数据库表。 groups --------- id (PK) name level resources --------- id (PK) name r
perl - 跨 Catalyst 应用程序共享身份验证
我有三个应用程序，为了便于管理，我希望将它们分开。他们按照建议作为 Plack 服务器运行 here , 代理在 nginx 后面。我想有一个单独的应用程序来管理登录，并在所有其他应用程序之间共享该
iphone - 跨 View 沟通
我的主窗口上有一个 UIWebView。我可以通过我的第二个 View Controller 来控制它吗？如果可以的话你能给我举个例子吗？最佳答案是的，你可以。 “如何”是一个基本的 Cocoa/
delphi - 跨 LAN 的安全通信
我想制作一个小型应用程序，从连接到串行端口的设备收集数据，并将其通过 LAN 传递到另一个应用程序，后者将其存储在数据库中。我已经在一台 PC 上的一个应用程序中完成了此操作，因此实际上会将应用程序
c# - 跨 AppDomain 异步方法调用
从主 AppDomain，我试图调用在不同 AppDomain 中实例化的类型中定义的异步方法。比如下面的类型MyClass继承自 MarshalByRefObject并在新的 AppDomain
python - 跨 LiveServerTestCase 测试方法保留数据？
因为 LiveServerTestCase继承自 TransactionTestCase ，默认行为是在每个测试方法结束时删除测试数据。我想用LiveServerTestCase类，但保留方法之间的测
wpf - 跨 View 模型的命令
我正在开发我的第一个 WPF/MVVM 应用程序，但我在命令知识方面遇到了限制! 这是我的场景。我有一个窗口——Customer.xaml。它包含 2 个用户控件查看CustomerSearch
c# - 跨 ViewModel 发布更新？
这是我的 WPF 应用程序模型的简化版本: Employee +Name:string Client +Name:string +PhoneNumber:string Appointmen
mercurial - 跨 Mercurial 子存储库进行身份验证
我有一个 mercurial 存储库，它使用子存储库功能(如 .hgsub 文件中定义的)引入依赖项，但我正在努力让它在 TeamCity 中工作。我启用了 mercurial_keyring 扩展
azure - 跨 Azure 租户的虚拟网络对等互连是否可行？
我正在尝试使用新的 Azure 虚拟网络公共(public)预览版的对等互连功能来加入我在两个不同订阅(即不同租户)上拥有的两个网络。这可能吗？我没有看到任何其他说法，但是当我尝试在 PowerShe
SVN 跨 2 个不同存储库的差异
我有 2 个存储库。由于主干代码位于一个 protected 存储库中，因此我进行了 checkout ，然后 checkin 到另一个存储库(因为用户没有第一个 protected 存储库的权限)。
C# 跨 dll 调试
我有一个项目，其调用结构与此类似: 主要项目/应用我的图书馆代码别人的库代码我的图书馆代码一切都是用 C# 编写的，我可以访问“其他人的库代码”。他们的代码不包含在我的项目中，因为它是开源的而

首页

博学

6Ren·AI

商城

postgresql - 使用 PostgreSQL MVCC 跨多个表的事务隔离

问题总结

其他问题

例子

尝试的解决方案

引用资料