Django 独特的批量插入-6ren

Django 独特的批量插入

转载作者：行者123 更新时间：2023-12-01 15:17:28

25

4

我需要能够快速批量插入大量记录，同时仍确保数据库中的唯一性。要插入的新记录已经被解析，并且是唯一的。我希望有一种方法可以在数据库级别强制执行唯一性，而不是在代码本身。

我使用 MySQL 作为数据库后端。如果 django 在任何其他数据库中支持此功能，我可以灵活地更改后端，因为这是一项要求。

Django 中的批量插入不使用save 方法，那么如何一次插入数百到数千条记录，同时仍然尊重唯一字段和唯一字段？

我的模型结构，经过简化，看起来像这样:

class Example(models.Model):
    Meta:
        unique_together = (('name', 'number'),)

    name = models.CharField(max_length = 50)
    number = models.CharField(max_length = 10)
    ...
    fk = models.ForeignKey(OtherModel)

编辑:

数据库中不存在的记录应该被插入，已经存在的记录应该被忽略。

最佳答案

正如 miki725 所提到的，您当前的代码没有问题。我假设您正在使用 bulk_create 方法。使用bulk_create时确实没有调用save()方法，但是在save()方法内部并没有强制字段的唯一性。当您使用 unique_together 时，一个unique constraint会在创建表时添加到 mysql 中的基础表中:

Django :

unique_together = (('name', 'number'),)

MySQL:

UNIQUE KEY `name` (`name`,`number`)

因此，如果您使用任何方法(save、bulk_insert 或什至原始 sql)向表中插入一个值，您将从 mysql 中获得此异常:

Duplicate entry 'value1-value2' for key 'name'

更新:

bulk_insert 所做的是创建一个大查询，该查询一次插入所有数据。因此，如果其中一个条目重复，它会抛出异常并且不会插入任何数据。

1- 一种选择是使用 bulk_insert 的 batch_size 参数并使其将数据插入多个批处理，这样如果其中一个批处理失败，您只会错过该批处理的其余数据。 (取决于插入所有数据的重要性以及重复条目的频率)

2- 另一种选择是在批量数据上编写一个 for 循环并逐个插入批量数据。这样，仅针对该行抛出异常，并插入其余数据。这每次都会查询数据库，当然会慢很多。

3- 第三个选项是解除唯一约束，使用 bulk_create 插入数据，然后编写一个简单的查询来删除重复的行。

关于Django 独特的批量插入，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15261821/

25

4

0

文章推荐： java - 类型转换和熔炼数据

文章推荐： c# - 如果您能够修改源代码，为什么还要使用扩展方法？

prometheus - 哪些用例真正使普罗米修斯的汇总指标类型成为必要/独特？
对于 Prometheus 指标集合，如标题，我真的找不到只能通过 type Summary 完成的用例。，似乎它们都可以通过 type Histogram 以某种方式完成还。让我们以请求并发度量
r - 不区分大小写独特保持原样
这个问题在这里已经有了答案: Ignore case while using duplicated (1 个回答) 关闭 9 个月前。使用不区分大小写的 unique(tolower(x)) 删除
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
group-by - DB2 独特 + xmlagg 查询
我想要相当于 DB2 中 MySql 的 GROUP_CONCAT 功能。我尝试过 DB2 的 XML Aggrigate 函数来合并 murows。 SELECT a.ID, sub
python - 雪花和 SQLAlchemy "unexpected ' 独特'
我正在运行 python 数据库迁移脚本 (Flask-Migrate) 并添加了 alembic.ddl.imp import DefaultImpl 来解决第一组错误，但现在我收到以下错误。我正在
bash - 排序 |独特 | xargs grep ... 其中行包含空格
我有一个逗号分隔的文件“myfile.csv”，其中第 5 列是日期/时间戳。 (mm/dd/yyyy hh:mm)。我需要列出所有包含重复日期的行(有很多) 我正在通过 cygwin 为 WinX
MySQL 5.7 | MySQL 5.7分组依据 |独特|聚合错误
我使用的是 MySQL 5.7。我有一个表格如下: -------------------------------------------------- | id | currentcy_id |
javascript - ng-repeat 中的 Angular 独特 ng-model
所以我有一个像这样的 ng-repeat: Join Ride /md-switch> 但是，每个 md-switch 都有相同的模型，因此当我在 Control
node.js - Mongoose 独特 :true pre-save hook calls hook before validation
据我了解， Mongoose 预保存 Hook 在将文档插入集合之前但在验证发生之后触发。因此，如果一次验证失败，则不会调用预保存 Hook 。就我而言，无论如何都会调用它们: 下面的简单代码的作用
awk - 重现 grep "my pattern"myfile.log |排序 |独特 | awk 中的 wc -l
如果我对我的目标文件执行此 grep，我会得到例如 275 作为结果。但是我想学习 awk，所以在 awk 中尝试了这个: awk 'BEGIN { count=0 } /my pattern/

首页

博学

6Ren·AI

商城

Django 独特的批量插入