- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要能够快速批量插入大量记录,同时仍确保数据库中的唯一性。要插入的新记录已经被解析,并且是唯一的。我希望有一种方法可以在数据库级别强制执行唯一性,而不是在代码本身。
我使用 MySQL 作为数据库后端。如果 django 在任何其他数据库中支持此功能,我可以灵活地更改后端,因为这是一项要求。
Django 中的批量插入不使用save
方法,那么如何一次插入数百到数千条记录,同时仍然尊重唯一字段和唯一字段?
我的模型结构,经过简化,看起来像这样:
class Example(models.Model):
Meta:
unique_together = (('name', 'number'),)
name = models.CharField(max_length = 50)
number = models.CharField(max_length = 10)
...
fk = models.ForeignKey(OtherModel)
编辑:
数据库中不存在的记录应该被插入,已经存在的记录应该被忽略。
最佳答案
正如 miki725 所提到的,您当前的代码没有问题。我假设您正在使用 bulk_create 方法。使用bulk_create时确实没有调用save()方法,但是在save()方法内部并没有强制字段的唯一性。当您使用 unique_together 时,一个unique constraint会在创建表时添加到 mysql 中的基础表中:
Django :
unique_together = (('name', 'number'),)
MySQL:
UNIQUE KEY `name` (`name`,`number`)
因此,如果您使用任何方法(save、bulk_insert 或什至原始 sql)向表中插入一个值,您将从 mysql 中获得此异常:
Duplicate entry 'value1-value2' for key 'name'
更新:
bulk_insert 所做的是创建一个大查询,该查询一次插入所有数据。因此,如果其中一个条目重复,它会抛出异常并且不会插入任何数据。
1- 一种选择是使用 bulk_insert 的 batch_size 参数并使其将数据插入多个批处理,这样如果其中一个批处理失败,您只会错过该批处理的其余数据。 (取决于插入所有数据的重要性以及重复条目的频率)
2- 另一种选择是在批量数据上编写一个 for 循环并逐个插入批量数据。这样,仅针对该行抛出异常,并插入其余数据。这每次都会查询数据库,当然会慢很多。
3- 第三个选项是解除唯一约束,使用 bulk_create 插入数据,然后编写一个简单的查询来删除重复的行。
关于Django 独特的批量插入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15261821/
对于 Prometheus 指标集合,如标题,我真的找不到只能通过 type Summary 完成的用例。 ,似乎它们都可以通过 type Histogram 以某种方式完成还。 让我们以请求并发度量
这个问题在这里已经有了答案: Ignore case while using duplicated (1 个回答) 关闭 9 个月前。 使用不区分大小写的 unique(tolower(x)) 删除
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次,要么最多每次 X 次(一天或一周等)。例如,这可以通过 Visual
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次,要么最多每次 X 次(一天或一周等)。例如,这可以通过 Visual
我想要相当于 DB2 中 MySql 的 GROUP_CONCAT 功能。 我尝试过 DB2 的 XML Aggrigate 函数来合并 murows。 SELECT a.ID, sub
我正在运行 python 数据库迁移脚本 (Flask-Migrate) 并添加了 alembic.ddl.imp import DefaultImpl 来解决第一组错误,但现在我收到以下错误。我正在
我有一个逗号分隔的文件“myfile.csv”,其中第 5 列是日期/时间戳。 (mm/dd/yyyy hh:mm)。 我需要列出所有包含重复日期的行(有很多) 我正在通过 cygwin 为 WinX
我使用的是 MySQL 5.7。 我有一个表格如下: -------------------------------------------------- | id | currentcy_id |
所以我有一个像这样的 ng-repeat: Join Ride /md-switch> 但是,每个 md-switch 都有相同的模型,因此当我在 Control
据我了解, Mongoose 预保存 Hook 在将文档插入集合之前但在验证发生之后触发。因此,如果一次验证失败,则不会调用预保存 Hook 。 就我而言,无论如何都会调用它们: 下面的简单代码的作用
如果我对我的目标文件执行此 grep,我会得到例如 275 作为结果。 但是我想学习 awk,所以在 awk 中尝试了这个: awk 'BEGIN { count=0 } /my pattern/
我是一名优秀的程序员,十分优秀!