gpt4 book ai didi

sql - Oracle 更新基于 2 个其他表的连接

转载 作者:行者123 更新时间:2023-12-04 14:19:25 25 4
gpt4 key购买 nike

我需要更新一个巨大的表,超过 10 亿条记录(POS 数据),其中一个键来自一个基于与第三个表的连接的表。我可以根据日期分解更新,因为这可以追溯到几年前。我基本上需要用 dedup.retail_sku_key 替换表 edw.f_pos_daily 中的 f.retail_sku_key 当它们不相同时。谢谢!

select  F.POS_KEY, f.retail_sku_key , dedup.retail_sku_key dedup_key 
from edw.f_pos_daily f,edw.d_retail_sku sku, edw.d_retail_sku_new dedup
where f.retail_sku_key = sku.retail_sku_key
and sku.retail_sku = dedup.retail_sku
and sku.mtd_item_number = dedup.mtd_item_number
and sku.retailer = dedup.retailer
and f.retail_sku_key <> dedup.retail_sku_key

最佳答案

虽然可能有一个 UPDATE 等效项,但我更喜欢在 SQL 语句驱动哪些行需要更新时使用 MERGE, 同时生成要更新的值。

那么,是这样的吗? (我假设 f.pos_key 是该 f_pos_daily 表上的唯一标识符。如果不是这种情况并且查询为相同的 f_pos_key 值返回不止一行,这将失败。)

MERGE INTO edw.f_pos_daily f_main
USING (
select f.pos_key -- this is for joining back to the rows that need to be updated...
, dedup.retail_sku_key dedup_key -- ...and this is the value to update them with
from edw.f_pos_daily f
, edw.d_retail_sku sku
, edw.d_retail_sku_new dedup
where f.retail_sku_key = sku.retail_sku_key
and sku.retail_sku = dedup.retail_sku
and sku.mtd_item_number = dedup.mtd_item_number
and sku.retailer = dedup.retailer
and f.retail_sku_key <> dedup.retail_sku_key
) qry
ON (f_main.pos_key = qry.pos_key)
WHEN MATCHED THEN
UPDATE SET f_main.retail_sku_key = qry.dedup_key
;

如果您确实需要将其分解为单独的更新,您可以通过两种方式分而治之:

1) 在内部查询中隔离 f_pos_daily 中的分区(假设该表由 retail_sku_key 以外的东西分区)例如FROM edw.f_pos_daily PARTITION (p_some_partition_name) 并为每个分区运行一次上述语句

2) 生成要更新的行范围(再次使用 f_pos_key=unique 假设),这将更新,比如说,每个行的 10%:

SELECT MIN(f_pos_key) c0,
PERCENTILE_DISC(0.1) WITHIN GROUP (ORDER BY f_pos_key) p1,
PERCENTILE_DISC(0.2) WITHIN GROUP (ORDER BY f_pos_key) p2,
PERCENTILE_DISC(0.3) WITHIN GROUP (ORDER BY f_pos_key) p3,
PERCENTILE_DISC(0.4) WITHIN GROUP (ORDER BY f_pos_key) p4,
PERCENTILE_DISC(0.5) WITHIN GROUP (ORDER BY f_pos_key) p5,
PERCENTILE_DISC(0.6) WITHIN GROUP (ORDER BY f_pos_key) p6,
PERCENTILE_DISC(0.7) WITHIN GROUP (ORDER BY f_pos_key) p7,
PERCENTILE_DISC(0.8) WITHIN GROUP (ORDER BY f_pos_key) p8,
PERCENTILE_DISC(0.9) WITHIN GROUP (ORDER BY f_pos_key) p9,
MAX(f_pos_key) c4
FROM edw.f_pos_daily;

如果值介于 0 和 1000 之间(以及一些未知的行数),这将为您提供如下输出:

P0  P1  P2  P3  P4  P5  P6  P7  P8  P9  P10
0 104 183 319 402 512 607 723 810 914 1000

从这里开始,您只需在子查询中包含另一个条件即可

AND f.pos_key BETWEEN 0 AND 104

第一次运行

AND f.pos_key BETWEEN 105 AND 183

在第二次运行时,以此类推。

关于sql - Oracle 更新基于 2 个其他表的连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36773831/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com