sql - 使用包含空值列的 WHERE 子句更新语句-6ren

sql - 使用包含空值列的 WHERE 子句更新语句

转载作者：行者123 更新时间：2023-11-29 11:17:10

25

4

我正在使用另一个表中的数据更新一个表中的列。 WHERE 子句基于多列，其中一些列为空。根据我的想法，这个空值是 丢弃 你的标准 UPDATE TABLE SET X=Y WHERE A=B 语句。

参见 this SQL Fiddle我尝试根据 table_two 中的数据更新 table_one 的两个表中的一个。我的查询目前看起来像这样:

UPDATE table_one SET table_one.x = table_two.y 
FROM table_two
WHERE 
table_one.invoice_number = table_two.invoice_number AND
table_one.submitted_by = table_two.submitted_by AND
table_one.passport_number = table_two.passport_number AND
table_one.driving_license_number = table_two.driving_license_number AND
table_one.national_id_number = table_two.national_id_number AND
table_one.tax_pin_identification_number = table_two.tax_pin_identification_number AND
table_one.vat_number = table_two.vat_number AND
table_one.ggcg_number = table_two.ggcg_number AND
table_one.national_association_number = table_two.national_association_number

当任一表中的任何列都为 null 时，table_one.x 中的某些行查询失败，不会更新。也就是说，只有当所有列都有一些数据时，它才会更新。

这个问题与我之前的问题有关here on SO我使用 Distinct On 从大型数据集中获取不同的值。我现在想要的是用具有唯一字段的表中的值填充大型数据集。

更新

我使用了@binotenary 提供的第一个更新语句。对于小表，它会瞬间运行。示例有一个包含 20,000 条记录的表，并且更新在大约 20 秒内完成。但是到目前为止，另一个有 900 万条记录的表已经运行了 20 个小时!。请参阅下面的 EXPLAIN 函数

的输出

Update on table_one  (cost=0.00..210634237338.87 rows=13615011125 width=1996)
  ->  Nested Loop  (cost=0.00..210634237338.87 rows=13615011125 width=1996)
    Join Filter: ((((my_update_statement_here))))
    ->  Seq Scan on table_one  (cost=0.00..610872.62 rows=9661262 width=1986)
    ->  Seq Scan on table_two  (cost=0.00..6051.98 rows=299998 width=148)

EXPLAIN ANALYZE 选项也用了很长时间，所以我取消了它。

关于如何加快此类更新的任何想法？即使这意味着使用不同的更新语句，甚至使用自定义函数循环执行更新。

最佳答案

由于 null = null 的计算结果为 false，除了相等性检查之外，您还需要检查两个字段是否均为 null:

UPDATE table_one SET table_one.x = table_two.y 
FROM table_two
WHERE 
    (table_one.invoice_number = table_two.invoice_number 
        OR (table_one.invoice_number is null AND table_two.invoice_number is null))
    AND
    (table_one.submitted_by = table_two.submitted_by 
        OR (table_one.submitted_by is null AND table_two.submitted_by is null))
    AND 
    -- etc

您还可以使用 coalesce更具可读性的函数:

UPDATE table_one SET table_one.x = table_two.y 
FROM table_two
WHERE 
    coalesce(table_one.invoice_number, '') = coalesce(table_two.invoice_number, '')
    AND coalesce(table_one.submitted_by, '') = coalesce(table_two.submitted_by, '')
    AND -- etc

但是您需要注意默认值(coalesce 的最后一个参数)。
它的数据类型应与列类型相匹配(例如，这样您就不会最终将日期与数字进行比较)并且默认值应该不会出现在数据中
例如 coalesce(null, 1) = coalesce(1, 1) 是您希望避免的情况。

更新(关于性能):

对 table_two 进行序列扫描 - 这表明您在 table_two 上没有任何索引。
因此，如果您更新 table_one 中的一行，然后要在 table_two 中找到匹配的行，数据库基本上必须逐行扫描所有行，直到找到匹配项。< br/>如果相关列被索引，则可以更快地找到匹配的行。

另一方面，如果 table_one 有任何索引，则会减慢更新速度。
根据this performance guide :

Table constraints and indexes heavily delay every write. If possible, you should drop all the indexes, triggers and foreign keys while the update runs and recreate them at the end.

来自同一指南的另一个可能有用的建议是:

If you can segment your data using, for example, sequential IDs, you can update rows incrementally in batches.

例如，如果 table_one 是一个 id 列，您可以添加如下内容

and table_one.id between x and y

到 where 条件并多次运行查询，更改 x 和 y 的值，以便覆盖所有行。

The EXPLAIN ANALYZE option took also forever

在处理带有副作用的语句时，在将 ANALYZE 选项与 EXPLAIN 一起使用时，您可能需要小心。根据documentation :

Keep in mind that the statement is actually executed when the ANALYZE option is used. Although EXPLAIN will discard any output that a SELECT would return, other side effects of the statement will happen as usual.

关于sql - 使用包含空值列的 WHERE 子句更新语句，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38500846/

25

4

0

文章推荐： postgresql - 在 psql 中定义多行字符串

文章推荐： postgresql - 将 PouchDB 离线同步到 PostgreSQL

文章推荐： c# - 在 Monotouch 中检测 UIPageViewController 中控件的触摸事件

文章推荐： php - php和mysql中 '->'是什么意思

javascript - Mongoose 更新/更新？
我查看了网站上的一些问题，但还没有完全弄清楚我做错了什么。我有一些这样的代码: var mongoose = require('mongoose'), db = mongoose.connect('m
javascript - 更新、退出、更新、进入带有转换的模式
基本上，根据 this bl.ocks，我试图在开始新序列之前让所有 block 都变为 0。我认为我需要的是以下顺序: 更新为0 退出到0 更新随机数输入新号码我尝试通过添加以下代码块来遵循上述
java - 强制在线程内进行 GUI 更新 - JSlider 更新
我试图通过使用随机数在循环中设置 JSlider 位置来模拟“赛马”的投注结果。我的问题是，当然，我无法在线程执行时更新 GUI，因此我的 JSlider 似乎没有在竞赛，它们从头到尾都在运行。我尝试
php - PDO 更新帮助执行 pdo 更新
该功能非常简单: 变量:$table是正在更新的表$fields 是表中的字段，$values 从帖子生成并放入 $values 数组中而$where是表的索引字段的id值$indxfldnm 是索引
java - 数据库多线程插入(更新)和单线程顺序插入(更新)的性能比较？
让我们想象一个环境:有一个数据库客户端和一个数据库服务器。数据库客户端可以是 Java 程序或其他程序等；数据库服务器可以是mysql、oracle等。需求是在数据库服务器上的一个表中插入大量记录。
php - 更新、插入和删除时的 MySQL 更新 ID
在我当前的应用程序中，我正在制作一个菜单结构，它可以递归地创建自己的子菜单。然而，由于这个原因，我发现很难也允许某种重新排序方法。大多数应用程序可能只是通过“排序”列进行排序，但是在这种情况下，尽管这
ios - 更新/过期后供应配置文件 key 将更改 - 更新
Provisioning Profile 有 key ， key 链依赖于它。我想知道 key 什么时候会改变。 Key will change after renew Provisioning Pr
javascript - 是否应该发布 MongoDB 插入/更新/更新/删除？
截至目前，我在\server\publications.js 中有我的 MongoDB“选择”，例如: Meteor.publish("jobLocations", function () { r
ios - Swift:更新 UI - 主线程上的整个功能或只是 UI 更新？
我读到 UI 应该始终在主线程上更新。但是，当谈到实现这些更新的首选方法时，我有点困惑。我有各种函数可以执行一些条件检查，然后使用结果来确定如何更新 UI。我的问题是整个函数应该在主线程上运行吗？应
docker - yum 更新/apk 更新/apt-get 更新在代理后面不起作用
我在代理后面，我无法构建 Docker 镜像。我试过 FROM ubuntu , FROM centos和 FROM alpine ，但是 apt-get update/yum update/apk
java - 更新-更新 java truststore 中的自签名 CA 证书
我构建了一个 Java 应用程序，它向外部授权客户端公开网络服务。 Web 服务使用带有证书身份验证的 WS-security。基本上我们充当自定义证书颁发机构 - 我们在我们的服务器上维护一个 ja
asp.net - 更新 dll 时使用 app_offline.htm 使应用程序脱机更新 dll 时失败
因此，我有时会在上传新版本时使用 app_offline.htm 使应用程序离线。但是，当我上传较大的 dll 时，我收到黄色错误屏幕，指出无法加载 dll。这似乎与我对 app_offline.
visual-studio-cordova - 更新 Node 和 NPM VS Cordova 更新 5
我刚刚下载了 VS Apache Cordova Tools Update 5，但遇到了 Node 和 NPM 的问题。我使用默认的空白 cordova 项目进行测试。版本如果我在 VS 项目中对
angularjs - 避免 ng-view 在 $location.search 更新 GET 参数时获取 "wiped"(更新)
所以我有一个使用传单库实例化的 map 对象。 map 实例在单独的模板中创建并以这种方式路由:- var app = angular.module('myApp', ['ui', 'ngResour
java - Java 6 更新 19,20 中的绘图性能与 Java 6 更新 3 相比？
我使用较早的 Java 6 u 3 获得的帧速率是新版本的两倍。很奇怪。谁能解释一下？在 Core 2 Duo 1.83ghz 上，集成视频(仅使用一个内核)- 1500(较旧的 java)与 70
javascript - angular ng-click inside ng-repeat 更新 $scope 然后使用 $apply 更新 dom
我正在使用 angular 1.2 ng-repeat 创建的 div 也包含 ng-click 点击时 ng-click 更新 $scope $scope 中的变化反射(reflect)在使用 $a
android - public final void moveCamera(CameraUpdate 更新)和 public final void animateCamera(CameraUpdate 更新)之间的区别？
这些方法有什么区别 public final void moveCamera(CameraUpdate更新)和public final void animateCamera (CameraUpdate
列表树(更新)
我尝试了另一篇文章中某人评论中关于如何将树更改为列表的建议。但是，我在某处(或某物)有未声明的变量，所以我列表中的值是 [_G667, _G673, _G679]，而不是 [5, 2, 6]，这是正确
Java数据库大数据量查询/更新
实现以下场景的最佳方法是什么？我需要从java应用程序调用/查询包含数百万条记录的数据库表。然后，对于表中的每条记录，我的应用程序应该调用第三方 API 并获取状态字段作为响应。然后我的应用程序应该
Java重绘()/更新()
只是在编写一些与 java 图形相关的代码，这是我今天的讲座中的非常简单的示例。不管怎样，互联网似乎说更新不会被系统触发器调用，例如调整框架大小等。在这个例子中，更新是由这样的触发器调用的(因此当我只

首页

博学

6Ren·AI

商城

sql - 使用包含空值列的 WHERE 子句更新语句

更新(关于性能):