postgresql - 防止复制 csv postgresql 上重复数据的最佳方法

转载作者：行者123 更新时间：2023-11-29 12:33:04

25

4

这更像是一个概念性问题，因为我正在计划如何最好地实现我们的目标。

我有一个包含 5 列的 postgresql/postgis 表。我将每 10 分钟左右通过复制命令将数据从 csv 文件插入/附加到数据库中。可能会有一些重复的数据行，所以我想将数据从 csv 文件复制到 postgresql 表，但要防止任何重复的条目从 csv 文件进入表。共有三列，如果它们都相等，则意味着该条目是重复的。它们是“纬度”、“经度”和“时间”。我应该从所有三列中制作一个复合键吗？如果我这样做，它会在尝试将 csv 文件复制到数据库时抛出错误吗？我将自动复制 csv 文件，所以我希望它继续复制文件的其余部分，而不是重复文件，而不是复制重复文件。有办法做到这一点吗？

此外，我当然希望它以最有效的方式查找重复项。我不需要通过整个表(这将是相当大的)来查找重复项......只需过去 20 分钟左右通过行上的时间戳。我已经用时间列为数据库编制了索引。

感谢您的帮助!

最佳答案

更新

Answer by Linoff是正确的，但可以通过 Postgres 9.5 new ”UPSERT“ feature 稍微简化一下(又名 MERGE )。该新功能在 Postgres 中实现为 INSERT ON CONFLICT语法。

我们可以让 ON CONFLICT 子句检测违规情况，而不是明确检查唯一索引的违规情况。然后我们DO NOTHING，这意味着我们放弃了 INSERT 的努力，而不必费心尝试 UPDATE。因此，如果我们不能插入，我们就移到下一行。

我们得到了与 Linoff 代码相同的结果，但丢失了 WHERE 子句。

INSERT INTO bigtable(col1, … )
    SELECT col1, …
    FROM stagingtable st
ON CONFLICT idx_bigtable_col1_col2_col
DO NOTHING
;

关于postgresql - 防止复制 csv postgresql 上重复数据的最佳方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31639108/

25

4

0

文章推荐： postgresql - 无法在 docker 中为 postgres 添加架构

文章推荐： IOS:如何填充 Nib 内的 UITableView？

文章推荐： ios - "You Must Define An Input Directory"应用加载器错误

Ruby 方法() 方法
我想了解 Ruby 方法 methods() 是如何工作的。我尝试使用“ruby 方法”在 Google 上搜索，但这不是我需要的。我也看过 ruby-doc.org，但我没有找到这种方法。
VBS教程：方法-Test 方法
Test 方法对指定的字符串执行一个正则表达式搜索，并返回一个 Boolean 值指示是否找到匹配的模式。 object.Test(string) 参数 object 必选项。总是一个
VBS教程：方法-Replace 方法
Replace 方法替换在正则表达式查找中找到的文本。 object.Replace(string1, string2) 参数 object 必选项。总是一个 RegExp 对象的名称。
VBS教程：方法-Raise 方法
Raise 方法生成运行时错误 object.Raise(number, source, description, helpfile, helpcontext) 参数 object 应为
VBS教程：方法-Execute 方法
Execute 方法对指定的字符串执行正则表达式搜索。 object.Execute(string) 参数 object 必选项。总是一个 RegExp 对象的名称。 string
VBS教程：方法-Clear 方法
Clear 方法清除 Err 对象的所有属性设置。 object.Clear object 应为 Err 对象的名称。说明在错误处理后，使用 Clear 显式地清除 Err 对象。此
VBS教程：方法-CopyFile 方法
CopyFile 方法将一个或多个文件从某位置复制到另一位置。 object.CopyFile source, destination[, overwrite] 参数 object 必选
VBS教程：方法-Copy 方法
Copy 方法将指定的文件或文件夹从某位置复制到另一位置。 object.Copy destination[, overwrite] 参数 object 必选项。应为 File 或 F
VBS教程：方法-Close 方法
Close 方法关闭打开的 TextStream 文件。 object.Close object 应为 TextStream 对象的名称。说明下面例子举例说明如何使用 Close 方
VBS教程：方法-BuildPath 方法
BuildPath 方法向现有路径后添加名称。 object.BuildPath(path, name) 参数 object 必选项。应为 FileSystemObject 对象的名称
VBS教程：方法-GetFolder 方法
GetFolder 方法返回与指定的路径中某文件夹相应的 Folder 对象。 object.GetFolder(folderspec) 参数 object 必选项。应为 FileSy
VBS教程：方法-GetFileName 方法
GetFileName 方法返回指定路径（不是指定驱动器路径部分）的最后一个文件或文件夹。 object.GetFileName(pathspec) 参数 object 必选项。应为
VBS教程：方法-GetFile 方法
GetFile 方法返回与指定路径中某文件相应的 File 对象。 object.GetFile(filespec) 参数 object 必选项。应为 FileSystemObject
VBS教程：方法-GetExtensionName 方法
GetExtensionName 方法返回字符串，该字符串包含路径最后一个组成部分的扩展名。 object.GetExtensionName(path) 参数 object 必选项。应
VBS教程：方法-GetDriveName 方法
GetDriveName 方法返回包含指定路径中驱动器名的字符串。 object.GetDriveName(path) 参数 object 必选项。应为 FileSystemObjec
VBS教程：方法-GetDrive 方法
GetDrive 方法返回与指定的路径中驱动器相对应的 Drive 对象。 object.GetDrive drivespec 参数 object 必选项。应为 FileSystemO
VBS教程：方法-GetBaseName 方法
GetBaseName 方法返回字符串，其中包含文件的基本名 (不带扩展名), 或者提供的路径说明中的文件夹。 object.GetBaseName(path) 参数 object 必
VBS教程：方法-GetAbsolutePathName 方法
GetAbsolutePathName 方法从提供的指定路径中返回完整且含义明确的路径。 object.GetAbsolutePathName(pathspec) 参数 object
VBS教程：方法-FolderExists 方法
FolderExists 方法如果指定的文件夹存在，则返回 True；否则返回 False。 object.FolderExists(folderspec) 参数 object 必选项
VBS教程：方法-FileExists 方法
FileExists 方法如果指定的文件存在返回 True；否则返回 False。 object.FileExists(filespec) 参数 object 必选项。应为 FileS

首页

博学

6Ren·AI

商城

postgresql - 防止复制 csv postgresql 上重复数据的最佳方法

更新