- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
业务:
我遇到了一个问题——当使用 Django ORM 操作大型数据集时,规范的方法是操作每个元素。但是当然这种方式是非常低效的。所以我决定使用原始 SQL。
物质:
我有一个构成 SQL 查询的基本代码,它更新表的行并提交它:
from myapp import Model
from django.db import connection, transaction
COUNT = Model.objects.count()
MYDATA = produce_some_differentiated_data() #Creating individual value for each row
cursor = connection.cursor()
str = []
for i in xrange(1, COUNT):
str.append("UPDATE database.table\n"
"SET field_to_modify={}\n"
"WHERE primary_key_field={};\n".format(MYDATA, i))
str = ''.join(str)
cursor.execute(str)
transaction.commit_unless_managed() #This cause exception
在最后一条语句中我得到了这个,即使 SIZE
很小:
_mysql_exceptions.ProgrammingError: (2014, "Commands out of sync; you can't run this command now")
也许 Django 不允许一次执行多个 SQL 查询?
附言在提交前关闭游标有助于避免异常,但这是正确的吗?
我的期望:
我正在寻找批量操作的所有可能的可靠解决方案(最好在 Django 内部)。我不关心它是 ORM 还是原始 SQL,如果我能避免错误,我会支持上面粘贴的代码。如果没有解决方案,至少出于好奇,了解此异常的原因会很好。
除了答案我还学到了什么:
在 Django 1.4 中引入了 bulk_create
, 用于高效的多个 INSERT
操作
最佳答案
Django 1.4+ 在它的 ORM 中对批量操作有相当不错的支持,你应该看看你是否可以使用它——它是最便携的方式,也非常好用。
它不仅允许为所有对象中的字段更新相同的值(这是微不足道的),还允许基于其他字段更新字段值以及执行一些有限的计算。我不确定它是否符合您的需要(取决于“produce_some_differentiated_data”的工作方式)-您可以进行一些计算,其中一些可能不会。一些例子:
image_id_list = [1,5,6]
Image.objects.filter(image_id__in=image_id_list).
update(views_number=F('views_number') + 1)
上面的例子会转换成类似如下的SQL:
UPDATE image SET views_number = views_number + 1 WHERE image_id IN (1,5,6);
这是执行批量更新最快的方法 - 比运行多个查询快得多。在单个 SQL 语句中运行多个查询并不能真正提高操作速度。改进它的是像上面这样同时对多行进行操作的单个查询。您可以在更新语句中构建相当复杂的公式,因此如果您的“produce_some_differentiated_data”方法可以用这种方式表达,那将是最好的。即使不能直接完成,您也可以对模型进行一些修改并添加一些额外的字段来实现。如果经常执行此类批量操作,这可能会有所返回。
来自 Django 的文档:
Django supports the use of addition, subtraction, multiplication, division and modulo arithmetic with F() objects, both with constants and with other F() objects.
更多相关信息: https://docs.djangoproject.com/en/dev/topics/db/queries/#updating-multiple-objects-at-once
关于python - Django:批量操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14035198/
我正在努力做到这一点 在我的操作中从数据库获取对象列表(确定) 在 JSP 上打印(确定) 此列表作为 JSP 中的可编辑表出现。我想修改然后将其提交回同一操作以将其保存在我的数据库中(失败。当我使用
我有以下形式的 Linq to Entities 查询: var x = from a in SomeData where ... some conditions ... select
我有以下查询。 var query = Repository.Query() .Where(p => !p.IsDeleted && p.Article.ArticleSections.Cou
我正在编写一个应用程序包,其中包含一个主类,其中主方法与GUI类分开,GUI类包含一个带有jtabbedpane的jframe,它有两个选项卡,第一个选项卡包含一个jtable,称为jtable1,第
以下代码产生错误 The nested query is not supported. Operation1='Case' Operation2='Collect' 问题是我做错了什么?我该如何解决?
我已经为 HA redis 集群(2 个副本、1 个主节点、3 个哨兵)设置了本地 docker 环境。只有哨兵暴露端口(10021、10022、10023)。 我使用的是 stackexchange
我正在 Desk.com 中构建一个“集成 URL”,它使用 Shopify Liquid 模板过滤器语法。对于开始日期为 7 天前而结束日期为现在的查询,此 URL 需要包含“开始日期”和“结束日期
你一定想过。然而情况却不理想,python中只能使用类似于 i++/i--等操作。 python中的自增操作 下面代码几乎是所有程序员在python中进行自增(减)操作的常用
我需要在每个使用 github 操作的手动构建中显示分支。例如:https://gyazo.com/2131bf83b0df1e2157480e5be842d4fb 我应该显示分支而不是一个。 最佳答
我有一个关于 Perl qr 运算符的问题: #!/usr/bin/perl -w &mysplit("a:b:c", /:/); sub mysplit { my($str, $patt
我已经使用 ArgoUML 创建了一个 ERD(实体关系图),我希望在一个类中创建两个操作,它们都具有 void 返回类型。但是,我只能创建一个返回 void 类型的操作。 例如: 我能够将 book
Github 操作仍处于测试阶段并且很新,但我希望有人可以提供帮助。我认为可以在主分支和拉取请求上运行 github 操作,如下所示: on: pull_request push: b
我正在尝试创建一个 Twilio 工作流来调用电话并记录用户所说的内容。为此,我正在使用 Record,但我不确定要在 action 参数中放置什么。 尽管我知道 Twilio 会发送有关调用该 UR
我不确定这是否可行,但值得一试。我正在使用模板缓冲区来减少使用此算法的延迟渲染器中光体积的过度绘制(当相机位于体积之外时): 使用廉价的着色器,将深度测试设置为 LEQUAL 绘制背面,将它们标记在模
有没有聪明的方法来复制 和 重命名 文件通过 GitHub 操作? 我想将一些自述文件复制到 /docs文件夹(:= 同一个 repo,不是远程的!),它们将根据它们的 frontmatter 重命名
我有一个 .csv 文件,其中第一列包含用户名。它们采用 FirstName LastName 的形式。我想获取 FirstName 并将 LastName 的第一个字符添加到它上面,然后删除空格。然
Sitecore 根据 Sitecore 树中定义的项目名称生成 URL, http://samplewebsite/Pages/Sample Page 但我们的客户有兴趣降低所有 URL(页面/示例
我正在尝试进行一些计算,但是一旦我输入金额,它就会完成。我只是希望通过单击按钮而不是自动发生这种情况。 到目前为止我做了什么: Angular JS - programming-fr
我的公司创建了一种在环境之间移动文件的复杂方法,现在我们希望将某些构建的 JS 文件(已转换和缩小)从一个 github 存储库移动到另一个。使用 github 操作可以实现这一点吗? 最佳答案 最简
在我的代码中,我创建了一个 JSONArray 对象。并向 JSONArray 对象添加了两个 JSONObject。我使用的是 json-simple-1.1.jar。我的代码是 package j
我是一名优秀的程序员,十分优秀!