gpt4 book ai didi

postgresql - 依靠 Postgres 的死锁检测来进行并发控制是否安全?

转载 作者:行者123 更新时间:2023-11-29 11:35:56 27 4
gpt4 key购买 nike

我的应用程序偶尔会遇到死锁,因为两个事务需要更新相同的行但顺序不同(例如,事务 A 更新行 X 然后 Y,而事务 B 更新行 Y 然后 X)。

由于各种原因,解决避免此类死锁的传统方法(锁定或以一致的顺序更新行)不太理想。

由于我尝试执行的更新在其他方面是幂等且与顺序无关的,因此简单地在应用程序级别捕获这些偶尔出现的死锁并重试事务是否安全合理?

例如:

def process_update(update):
attempt = 0
while attempt < 10:
try:
execute("SAVEPOINT foo")
for row in update:
execute("UPDATE mytable SET … WHERE …", row)
execute("RELEASE SAVEPOINT foo")
break
except Deadlock:
execute("ROLLBACK TO SAVEPOINT foo")
attempt += 1
raise Exception("Too many retries")

这是一个合理的想法吗?或者是否存在与 Postgres 的死锁检测相关的成本,这可能会使其变得危险?

最佳答案

我针对在同一张表上运行 50 到 100 个并发进程的系统对此进行了大量研究和实验。除了基本的死锁之外,还可能发生许多事务失败。我的案例包括读取已提交和可序列化的事务。在应用程序级别处理此问题不会导致任何问题。幸运的是,Postgres 会立即失败,因此唯一的性能影响是对应用程序的影响,对数据库没有什么影响。

关键部件每type of error ,知道哪些情况需要回滚,并且有一个 exponential backoff for retries .我发现立即重试或静态休眠时间会导致进程简单地反复死锁并导致有点多米诺骨牌效应,这是有道理的。

这是我的系统处理每个并发问题所需的完整逻辑(伪代码):

begin transaction (either read committed or serializable)
while not successful and count < 5
try
execute sql
commit
except
if error code is '40P01' or '55P03'
# Deadlock or lock not available
sleep a random time (200 ms to 1 sec) * number of retries
else if error code is '40001' or '25P02'
# "In failed sql transaction" or serialized transaction failure
rollback
sleep a random time (200 ms to 1 sec) * number of retries
begin transaction
else if error message is 'There is no active transaction'
sleep a random time (200 ms to 1 sec) * number of retries
begin transaction
increment count

关于postgresql - 依靠 Postgres 的死锁检测来进行并发控制是否安全?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42319930/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com