oracle - Oracle 上的大规模 UPDATE 与 MERGE 性能-6ren

oracle - Oracle 上的大规模 UPDATE 与 MERGE 性能

转载作者：行者123 更新时间：2023-12-05 01:32:02

25

4

我正在尝试使用单个大量 UPDATE 语句从源表更新目标表，但执行时间比应有的长得多。

查询

UPDATE MY_DEST
SET (DEST_B, DEST_C) = (
  SELECT SRC_A + SRC_B, SRC_B
  FROM MY_SRC
  WHERE SRC_KEY = DEST_KEY AND SRC_DATE = DEST_DATE
);

两个表都包含大约 10 到 1300 万行，它们具有匹配的主键，我们可以安全地假设目标表中的每一行在源表中都有对应的行。

表格定义

CREATE TABLE MY_SRC (
  SRC_KEY VARCHAR2(50),
  SRC_DATE DATE,
  SRC_A NUMBER(15,2),
  SRC_B NUMBER(15,2),
  CONSTRAINT MY_SRC_PK PRIMARY KEY (SRC_KEY, SRC_DATE)
);

CREATE TABLE MY_DEST (
  DEST_KEY VARCHAR2(50),
  DEST_DATE DATE,
  DEST_B NUMBER(15,2),
  DEST_C NUMBER(15,2),
  CONSTRAINT MY_DEST_PK PRIMARY KEY (DEST_KEY, DEST_DATE)
);

执行计划

Plan hash value: 3904754293

------------------------------------------------------------------------------------------
| Id  | Operation                    | Name      | Rows  | Bytes | Cost (%CPU)| Time     |
------------------------------------------------------------------------------------------
|   0 | UPDATE STATEMENT             |           |    12M|   675M|   128M (20)| 01:23:55 |
|   1 |  UPDATE                      | MY_DEST   |       |       |            |          |
|   2 |   TABLE ACCESS FULL          | MY_DEST   |    12M|   675M| 69756   (1)| 00:00:03 |
|   3 |   TABLE ACCESS BY INDEX ROWID| MY_SRC    |     1 |    46 |     4   (0)| 00:00:01 |
|*  4 |    INDEX UNIQUE SCAN         | MY_SRC_PK |     1 |       |     3   (0)| 00:00:01 |
------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

4 - access("SRC_KEY"=:B1 AND "SRC_DATE"=:B2)

问题

上面的 UPDATE 查询是否无可救药地被迫使用缓慢的逐行执行计划？

我能否仅通过将其重写为 MERGE 语句来优化上述查询，例如下面的语句？

替代查询，重写为 MERGE

MERGE INTO MY_DEST
USING (SELECT SRC_KEY, SRC_DATE, SRC_B, SRC_A + SRC_B AS SRC_C FROM MY_SRC)
ON (DEST_KEY = SRC_KEY AND DEST_DATE = SRC_DATE)
WHEN MATCHED THEN UPDATE SET DEST_B = SRC_B, DEST_C = SRC_C;

备用执行计划

Plan hash value: 2444580570

----------------------------------------------------------------------------------------
| Id  | Operation            | Name    | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
----------------------------------------------------------------------------------------
|   0 | MERGE STATEMENT      |         |    12M|   638M|       |   359K  (1)| 00:00:15 |
|   1 |  MERGE               | MY_DEST |       |       |       |            |          |
|   2 |   VIEW               |         |       |       |       |            |          |
|*  3 |    HASH JOIN         |         |    12M|  2260M|   716M|   359K  (1)| 00:00:15 |
|   4 |     TABLE ACCESS FULL| MY_SRC  |    12M|   568M|       |   162K  (1)| 00:00:07 |
|   5 |     TABLE ACCESS FULL| MY_DEST |    12M|  1695M|       | 69756   (1)| 00:00:03 |
----------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   3 - access("DEST_KEY"="SRC_KEY" AND "DEST_DATE"="SRC_DATE")

当使用 UPDATE 时，我能否获得与备用 MERGE 语句相同的良好性能？

我正在使用 Oracle 12c。

最佳答案

1) 是的，您永远不想对大型表进行(估计)1200 万次索引访问。

索引 block 大部分位于磁盘上，因此您可能期望每秒访问 100 行。

即使由于缓存而每秒获得 1000 个索引访问，您仍然需要等待数小时才能处理 1200 万行。

因此执行计划 1 对于大表来说是NO GO。

2) MERGE 的执行计划(具有两次全表扫描的散列连接)看起来不错，应该可以工作。

3) 是的，您可以在设置中毫无问题地使用 UPDATE 语句。您将使用 updatable join view 的功能

查询

update (
select SRC_A, SRC_B,DEST_B, DEST_C 
from MY_DEST d
left outer join MY_SRC s
on d.DEST_KEY = s.SRC_KEY and d.DEST_DATE = s.SRC_DATE)
set DEST_B = SRC_A + SRC_B,
    DEST_C = SRC_B
;

执行计划

---------------------------------------------------------------------------------------
| Id  | Operation           | Name    | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |
---------------------------------------------------------------------------------------
|   0 | UPDATE STATEMENT    |         |  1000K|    57M|       |  6682   (1)| 00:00:01 |
|   1 |  UPDATE             | MY_DEST |       |       |       |            |          |
|*  2 |   HASH JOIN OUTER   |         |  1000K|    57M|    40M|  6682   (1)| 00:00:01 |
|   3 |    TABLE ACCESS FULL| MY_DEST |  1000K|    28M|       |  1341   (2)| 00:00:01 |
|   4 |    TABLE ACCESS FULL| MY_SRC  |  1000K|    28M|       |  1341   (2)| 00:00:01 |
---------------------------------------------------------------------------------------
 
Predicate Information (identified by operation id):
---------------------------------------------------
 
   2 - access("D"."DEST_DATE"="S"."SRC_DATE"(+) AND 
              "D"."DEST_KEY"="S"."SRC_KEY"(+))

您会看到为 MERGE 创建了类似的执行计划，因此您会期待类似的性能。

最后的笔记

您还可以使用并行提示来加快速度。

别忘了您必须启用 parallel dml在你的 session 中。

ALTER SESSION ENABLE PARALLEL DML;

您的MERGE 语句不等于您的第一个UPDATE 语句。当目标表中存在主键但源表中不存在时，就会出现差异。

UPDATE 将目标列重置为 NULL，而 MERGE 让它们不变。

我的UPDATE语句使用外连接，因此它的行为与您的UPDATE - 切换到内连接获取 MERGE 行为。

关于oracle - Oracle 上的大规模 UPDATE 与 MERGE 性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65829430/

25

4

0

文章推荐： Flutter Web- 播放 uint8list n videoplayer

文章推荐： R - 将 df 或矩阵的每一行与一个向量相乘

oracle - Oracle 即时客户端和 Oracle 客户端的区别
Oracle 即时客户端和 Oracle 客户端有什么区别？你能给我解释一下吗？谢谢最佳答案 Oracle 客户端带有安装程序和许多可执行文件，例如 sqlplus，tnsping，它是完整而庞大的
oracle - 无需安装 Oracle 客户端即可连接 ORACLE 数据库服务器的替代方案
我正在寻找一个Delphi组件来直接连接到ORACLE数据库服务器，而无需安装oracle客户端。我知道Oracle Data Access (ODAC)来自DevArt 。还有其他组件具有此功能吗
oracle - 使用 Oracle 表作为输入参数编写 Oracle 存储过程
如何编写 Oracle 存储过程，以表 (X) 作为输入参数，并在过程内部使用表 X 来与另一个表 Y 联接？表 X 将包含数千条记录。不希望将表名作为 varchar 传递，然后使用动态 SQL
oracle - 使用 Oracle 表作为输入参数编写 Oracle 存储过程
如何编写 Oracle 存储过程，以表 (X) 作为输入参数，并在过程内部使用表 X 来与另一个表 Y 联接？表 X 将包含数千条记录。不希望将表名作为 varchar 传递，然后使用动态 SQL
oracle - Oracle sql中如何过滤空值
我要过滤COMMENTS属性为空的记录我试过了 SELECT TABLE_NAME, COMMENTS FROM (SELECT TABLE_NAME, COMMENTS FROM (sel
oracle - Oracle 工具的替代下载站点
我要下载 Oracle Instant Client for Linux x86-64 (64-bit)现在有一段时间了。现在我注意到该网站在过去几个月中一直遇到技术问题。要从 Oracle 下载
oracle - 没有安装 Oracle 客户端的 Delphi FireDac + Oracle
有什么方法可以将我的 Delphi 应用程序 (FireDac) 直接连接到 Oracle 数据库？目前可以连接，但需要安装Oracle Client 在 embarcadero 站点 ( http
oracle - where子句中的日期格式-Oracle
我有一张表，其中日期列的数据格式如下:“7/25/2014 12:14:27 AM”。我需要通过放入 where 子句来获取此日期。有人可以建议我该怎么做吗？最佳答案日期(存储在表中)是 repr
oracle - Oracle 中两个事务可以同时修改同一行吗？
如果两个事务试图同时修改同一行会发生什么？通常，一旦行被修改，另一个事务等待直到第一个事务执行提交或回滚。但是，如果他们恰好在同一时刻发送更新请求怎么办？最佳答案答案是否定的。两个事务不能同时修改
oracle - Oracle 模式中具有相同名称的两个索引
我想知道为什么我不能在 Oracle 模式中有两个同名的索引？它抛出一个错误，指出该名称已被使用。我的印象是，由于索引在一个特定的表上，这应该不会导致任何错误，除非我们对同一个表上的两个不同列使用相同
oracle - Oracle sql中的rownum与group by
我需要构建一个查询来按成员和到期日期检索信息组，但我需要为每个成员提供一个序列号.. 例如: 如果成员“A”有 3 条记录要过期，“B”只有 1 条，“C”有 2 条，我需要这样的结果: Number
oracle - Oracle 中的存储过程和独立过程有什么区别？
独立程序 create procedure proc1 ( begin end; ) 存储过程 create package pkg1 ( procedure proc2 begin end; ) 最
oracle - Oracle 中的外键约束问题
在 Oracle 9i 中声明 FK 时遇到问题。我在这里查看了许多关于 SO 和一些在线文档(例如 http://www.techonthenet.com/oracle/foreign_keys/f
oracle - Oracle 序列存储在哪个表空间中？
我和我的同事维护的应用程序在后端有一个 Oracle 数据库。我们正在考虑偶尔以“受限”模式运行应用程序，其中一个数据库表空间设置为只读。我们可以轻松地将必要的表和索引移动到单独的表空间，这些表空间将
oracle - Oracle 的用户定义聚合函数可以定义为用于两列吗？
我想实现一个自定义的回归聚合函数，类似于现有的 REGR_SLOPE . 我要定义的函数需要获取两列作为参数，例如 select T.EMPLOYEE_ID, CUSTOM_REGR_SL
oracle - Oracle 脚本中的错误处理
我已经尝试解决这个问题一段时间了，我认为是时候寻求帮助了。我正在构建一个架构配置脚本，我想添加一些脚本输出和错误处理。这个想法是脚本输出窗口只会向我显示关键消息而没有所有噪音。 Create Temp
oracle - Oracle 批量更新速度慢
在旧的 Oracle 服务器(我被告知是 8i)上使用 JDBC 时，我遇到了一个非常令人困惑和奇怪的问题。我在那里准备了一个表，其中包含大约 10 列、数字、varchars、一个 raw(255)
oracle - Oracle 分区表的唯一索引
我有一张 table Customer_Chronics在 Oracle 11g 中。该表具有三个关键列，如下所示: 分支代码客户 ID 期我已按 branch_code 列表按表分区，现在我进
oracle - oracle 在哪里存储用户定义的异常？
是否有存储用户自定义异常的oracle表？最佳答案没有。与其他变量一样，用户定义的异常在 PL/SQL block 中定义，并且具有 PL/SQL 变量将具有的任何范围。所以，例如 DECLAR
oracle - Oracle 中的序列与标识列
在 oracle 中使用序列并使用 Before insert trigger 自动递增列或使用标识列是否更好，因为它在 Oracle 12 c 中可用？最佳答案无论哪种方式，您都将使用序列。 1

首页

博学

6Ren·AI

商城

oracle - Oracle 上的大规模 UPDATE 与 MERGE 性能