sql - INSERT ON CONFLICT DO NOTHING 和 SELECT 之间的竞争条件-6ren

sql - INSERT ON CONFLICT DO NOTHING 和 SELECT 之间的竞争条件

转载作者：行者123 更新时间：2023-12-04 14:51:17

SELECT 查询在 INSERT … ON CONFLICT DO NOTHING 语句之后是否总能找到一行，给定默认事务隔离(已提交读取)？

我想在一个表中INSERT-or-SELECT 一行，然后在第二个表中插入行时引用它。自 RETURNING doesn't work well with ON CONFLICT ，到目前为止我已经使用了a simple CTE即使该行已经存在，它也应该始终给我标识列值:

$id = query(
  `WITH ins AS (
    INSERT INTO object (scope, name)
    VALUES ($1, $2)
    ON CONFLICT (scope, name) DO NOTHING
    RETURNING id
  )
  SELECT id FROM ins
  UNION  ALL
  SELECT id FROM object WHERE scope = $1 AND name = $2
  LIMIT 1;`,
  [$scope, $name]
)
query(
  `INSERT INTO object_member (object_id, key, value)
  SELECT $1, UNNEST($2::text[]), UNNEST($3::int[]);`
  [$id, $keys, $values]
)

但是，我了解到 this CTE is not entirely safe under concurrent write load ，当不同的事务确实插入同一行时，upsert 和 select 都可能出现空的情况。

在那里的答案(以及 here)建议使用另一个查询来执行 SELECT:

start a new command (in the same transaction), which then can see these conflicting rows from the previous query.

如果我没理解错的话，应该是做

$id = query(
  `INSERT INTO object (scope, name)
  VALUES ($1, $2)
  ON CONFLICT (scope, name) DO NOTHING
  RETURNING id;`,
  [$scope, $name]
)
if not $id:
  $id = query(
    `SELECT id FROM object WHERE scope = $1 AND name = $2;`
    [$scope, $name]
  )
query(
  `INSERT INTO object_member (object_id, key, value)
  SELECT $1, UNNEST($2::text[]), UNNEST($3::int[]);`
  [$id, $keys, $values]
)

甚至缩短为

query(
  `INSERT INTO object (scope, name)
  VALUES ($1, $2)
  ON CONFLICT (scope, name) DO NOTHING;`,
  [$scope, $name]
)
query(
  `INSERT INTO object_member (object_id, key, value)
  SELECT (SELECT id FROM object WHERE scope = $1 AND name = $2), UNNEST($3::text[]), UNNEST($3::int[]);`
  [$scope, $name, $keys, $values]
)

我相信这足以防止特定的竞争条件(在 this answer 中称为“并发问题 1”)——但我不能 100% 确定没有遗漏任何东西。

“并发问题 2”又如何呢？如果我理解正确，这是关于另一个事务删除或更新现有行，在 INSERT 和 SELECT 语句之间 - 使用多个查询而不是使用多个查询时更有可能发生CTE 方法。我应该如何处理呢？我假设在第二个代码片段中需要使用 FOR KEY SHARE 锁定 SELECT - 但我是否也需要在 id 的第三个片段中使用它> 在同一查询中使用？如果有助于简化答案，我们假设一个 object 只能插入或删除，但永远不会更新。

最佳答案

要绝对确保第一个表中的单行存在并返回它的 ID，您可以创建如下所示的函数:

Is SELECT or INSERT in a function prone to race conditions?

要确保该行在交易期间也保持在那里，只需确保它已锁定。如果您 INSERT 该行，它无论如何都会被锁定。如果您SELECT 一个现有的id，您必须明确地锁定它——就像您建议的那样。 FOR KEY SHARE只要在 (scope, name) 上有一个(非部分的、非功能性的)UNIQUE 索引就足以满足我们的目的，可以安全地假设给定你的 ON CONFLICT 子句。

CREATE OR REPLACE FUNCTION f_object_id(_scope text, _name text, OUT _object_id int)
  LANGUAGE plpgsql AS
$func$
BEGIN
LOOP
   SELECT id FROM object
   WHERE  scope = $1
   AND    name  = $2
   -- lock to prevent deletion in the tiny time frame before the next INSERT
   FOR    KEY SHARE
   INTO   _object_id;

   EXIT WHEN FOUND;

   INSERT INTO object AS o (scope, name)
   VALUES ($1, $2)
   ON     CONFLICT (scope, name) DO NOTHING
   RETURNING o.id
   INTO   _object_id;

   EXIT WHEN FOUND;
END LOOP;
END
$func$;

如果可以想象并发事务可能会在DELETE它(你不需要UPDATE)在SELECT 和下一个 INSERT 语句。

此外，如果您有从 object_member.object_id 到 object.id 的 FOREIGN KEY 约束(这似乎很可能)，则参照完整性是无论如何保证。如果您不添加显式锁，并且在中间删除行，则会违反外键，并且 object_member 的 INSERT 被取消，连同整个交易。否则，具有 DELETE 的其他事务必须等到您的事务完成，然后被相同的 FK 约束取消，因为依赖行现在在那里(除非它被定义为 CASCADE ...) 因此，通过锁定(或不锁定)，您可以决定在这种情况下是阻止 DELETE 还是 INSERT。

然后你的电话就变成了:

query(
  `WITH o(id) AS (SELECT f_object_id($1, $2))
   INSERT INTO object_member (object_id, key, value)
   SELECT o.id, UNNEST($3::text[]), UNNEST($4::int[])
   FROM   o;`
  [$scope, $name, $keys, $values]
)

由于您显然将多行插入到 object_member 中，我将 f_object_id($1, $2) 移动到 CTE 以避免重复执行 - 这将有效，但毫无意义的昂贵。

在 Postgres 12 或更高版本中，我会 make that explicit by adding MATERIALIZED (因为 INSERT 隐藏在函数中):

WITH o(id) AS MATERIALIZED (SELECT f_object_id($1, $2)) ...

旁白:对于 SELECT 列表中的多个 unnest()，请确保您使用的是 Postgres 10 或更高版本。见:

What is the expected behaviour for multiple set-returning functions in SELECT clause?

细节问题

Will it make any difference (apart from execution time) to do this in the application logic with multiple queries in the same transaction?

基本上没有。唯一的区别是性能。嗯，短代码和可靠性。对于每个循环，在 db 和 client 之间来回切换客观上更容易出错。但除非你有极具竞争力的交易，否则你几乎永远不会循环。

另一个考虑是:这件事很棘手，大多数开发人员都不了解。封装在服务器端功能中，它不太可能被下一个应用程序程序员(或您自己)破坏。您还必须确保它也被实际使用。无论哪种方式，请正确记录您以某种方式这样做的原因......

I really wonder whether my second snippet is safe, or why not (given the quote about visibility in the SELECT after the INSERT).

大部分安全，但并非绝对安全。虽然下一个单独的 SELECT 将看到(现在已提交)与之前的 UPSERT 竞争的事务行，但没有什么可以阻止第三个事务在此期间再次删除它。该行尚未被锁定，当它不可见时您无法执行此操作，并且 Postgres 中没有可用的通用谓词锁定。

考虑一下(T1、T2、T3 是并发事务):

                               T2: BEGIN transaction
T1: BEGIN transaction
                               T2: INSERT object 666
T1: UPSERT object 666
    unique violation?
    -> wait for T2
                               T2: COMMIT
T1: unique violation -> NO ACTION
    finish statement
    can't return invisible object 666
                                             T3: DELETE object 666 & COMMIT
T1: SELECT object 666 -> no row!
    BOOM!

通常情况下，这种情况极不可能发生。
但这是可能的。因此循环。

另一个选项是SERIALIZABLE transaction isolation .通常更昂贵，并且您需要为序列化失败做好准备。第 22 条。

关于sql - INSERT ON CONFLICT DO NOTHING 和 SELECT 之间的竞争条件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69052005/

文章推荐： azure - 将 Azure 托管的机器人添加到 Microsoft Teams 开发门户

文章推荐： html - 同时改变 parent 和 child 的 flex 会触发闪烁

文章推荐： javascript - 如何像预加载器一样实现 Youtube

文章推荐： reactjs - 如何在 Redux Toolkit 中订阅 React 组件之外的状态？

mySQL IF 条件 THEN 条件
我正在努力处理查询的 WHERE 部分。查询本身包含一个基于两个表中都存在的 ID 的 LEFT JOIN。但是，我要求 where 语句仅返回其中一列中存在的最大单个结果。目前我返回连接中的所有值，
python - 我的代码有一个 if-else 条件，但我认为代码没有检查 if 条件，而是直接进入 else 条件
我有这个代码来改变文件系统的大小。问题是，即使满足 if 条件，它也不会进入 if 条件，而我根本没有检查 if 条件。它直接进入 else 条件。运行代码后的结果 post-install-ray
excel - SUMIF(条件，值)、SUMPROD(条件，值)和 SUM(条件*值)之间的区别
假设我有一个包含 2 列的 Excel 表格:单元格 A1 到 A10 中的日期和 B1 到 B10 中的值。我想对五月日期的所有值求和。我有3种可能性: {=SUM((MONTH(A1:A10)=
LINQ:选择 <条件> 或 <条件>
伪代码: SELECT * FROM 'table' WHERE ('date' row.date 或，我们在Stack Overflow上找到一个类似的问题： https://stackove
mysql - Yii 条件 - 修改以包含 OR 条件
我有下面这行代码做一个简单的查询 if ($this->fulfilled) $criteria->addCondition('fulfilled ' . (($this->fulfilled
PHP 条件 vs MySQL 条件
如果在数据库中找到用户输入的键，我将尝试显示“表”中的数据。目前我已将其设置为让数据库检查 key 是否存在，如下所示: //Select all from table if a key entry
我们是否可以通过改变 if 条件，在执行完 else 条件后返回执行 if 条件？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 5 年前。 Improve th
mysql - 是否可以先加入 if 条件，然后再加入 Else 条件
在MYSQL中可以吗一共有三个表任务(task_id、task_status、...) tasks_assigned_to(ta_id、task_id、user_id) task_suggeste
mysql - 首先按(条件)排序，然后按(条件)排序
我想先根据用户的状态然后根据用户名来排序我的 sql 请求。该状态由 user_type 列设置: 1=活跃，2=不活跃，3=创始人。我会使用此请求来执行此操作，但它不起作用，因为我想在“活跃”成员
c# - 嵌套的 if 条件 vs 多个分离的 if 条件，每个条件都有 return 语句
下面两个函数中最专业的代码风格是什么？如果函数变得更复杂和更大，例如有 20 个检查怎么办？注意:每次检查后我都需要做一些事情，所以我不能将所有内容连接到一个 if 语句中，例如: if (veh
sql-server - OrderBy().FirstOrDefault(<条件>) 与Where(<条件>).OrderBy().FirstOrDefault()
我在 C# 项目中使用 EntityFramework 6.1.3 和 SQL Server。我有两个查询，基本上应该执行相同的操作。 1. Exams.GroupBy(x=>x.SubjectID)
postgresql - CASE WHEN 条件 1 AND 条件 2 then x else y postgreSQL
我试图在 case when 语句中放入两个条件，但我在 postgresql 中遇到语法错误 case when condition 1 and condition 2 then X else Y
php - 在 LEFT JOIN table1 ON 条件 1 OR 条件 2 中使用 OR 会导致不必要的问题吗？
我正在构建一个连接多个表的查询，一个表 prodRecipe 将包含某些行的数据，但不是全部，但是 tmp_inv1 将包含所有行的计数信息。问题是，tmp_inv1.count 取决于某个项目是否在
SQL INDEX 不用于 WHERE ABS(x-y) < k 条件，但用于 y - k < x < y + k 条件
我有一个涉及 couples of rows which have a less-than-2-hours time-difference 的查询(~0.08333 天): SELECT mt1.*,
Perl OR 条件
我有一个包含许多这样的 OR 条件的代码(工作正常)来检查其中一个值是否为空，然后我们抛出一条错误消息(所有这些都必须填写) } elsif ( !$params{'account'}
SQL 条件 where
我有一个名为 spGetOrders 的存储过程，它接受一些参数:@startdate 和 @enddate。这将查询“订单”表。表中的一列称为“ClosedDate”。如果订单尚未关闭，则此列将保留
LINQ - if 条件
在代码中，注释部分是我需要解决的问题...有没有办法在 LINQ 中编写这样的查询？我需要这个，因为我需要根据状态进行排序。 var result = ( from contact in d
SQL:条件 AND in where
我正在尝试创建一个允许省略参数的存储过程，但如果提供了参数，则进行 AND 操作: CREATE PROCEDURE MyProcedure @LastName Varchar(30)
正则表达式 IF 条件
我正在寻找一种方法来过滤我的主机文件中的新 IP 地址。我创建了一个脚本，每次我用来自矩阵企业管理器的数据调用它时都会更新我的主机文件。它工作正常。但是我必须找到一个解决方案，只允许更新 10.XX.
jQuery 条件
所以我正在做一种 slider ，当它完全向下时隐藏向下按钮，反之亦然，当向上按钮隐藏时，我遇到了问题。 var amount = $('slide').attr('number'); $('span

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

sql - INSERT ON CONFLICT DO NOTHING 和 SELECT 之间的竞争条件

细节问题