- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用带有 Postgres 后端的 SQLAlchemy 来执行批量插入或更新。为了提高性能,我尝试每千行左右只提交一次:
trans = engine.begin()
for i, rec in enumerate(records):
if i % 1000 == 0:
trans.commit()
trans = engine.begin()
try:
inserter.execute(...)
except sa.exceptions.SQLError:
my_table.update(...).execute()
trans.commit()
但是,这是行不通的。似乎当 INSERT 失败时,它会使事情处于一种奇怪的状态,从而阻止 UPDATE 发生。是否自动回滚交易?如果是这样,这可以停止吗?我不希望我的整个事务在出现问题时回滚,这就是为什么我首先 try catch 异常。
顺便说一句,我得到的错误消息是“sqlalchemy.exc.InternalError:(InternalError)当前事务被中止,命令被忽略直到事务 block 结束”,它发生在 update().execute()打电话。
最佳答案
您遇到了一些奇怪的 Postgresql 特定行为:如果事务中发生错误,它会强制回滚整个事务。我认为这是一个 Postgres 设计错误;在某些情况下,需要相当多的 SQL 扭曲才能解决。
一种解决方法是先执行更新。通过查看 cursor.rowcount 来检测它是否真的修改了一行;如果它没有修改任何行,则它不存在,INSERT 也不存在。 (当然,如果更新频率高于插入频率,这会更快。)
另一种解决方法是使用保存点:
SAVEPOINT a;
INSERT INTO ....;
-- on error:
ROLLBACK TO SAVEPOINT a;
UPDATE ...;
-- on success:
RELEASE SAVEPOINT a;
这对于生产质量代码有一个严重的问题:您必须准确地检测错误。据推测,您预计会遇到唯一约束检查,但您可能会遇到意想不到的事情,并且几乎不可能可靠地区分预期错误和意外错误。如果这不正确地遇到错误条件,则会导致模糊的问题,即不会更新或插入任何内容,也不会看到任何错误。对此要非常小心。您可以通过查看 Postgresql 的错误代码来缩小错误案例的范围,以确保它是您期望的错误类型,但潜在的问题仍然存在。
最后,如果你真的想做批量插入或更新,你实际上想在几个命令中做很多,而不是每个命令一个项目。这需要更棘手的 SQL:SELECT 嵌套在 INSERT 中,过滤出要插入和更新的正确项目。
关于python - 如何使用 SQLAlchemy 高效地进行批量插入或更新?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1330475/
我正在尝试创建一个使用 UUID 作为主键的用户模型: from src.db import db # SQLAlchemy instance import sqlalchemy_utils impo
在 sqlalchemy 中,我试图合并表,然后使用 WHERE 和 ORDER_BY 创建别名 有点像 SELECT * FROM ( SELECT [TABLE_ONE].[SOME_ID]
我正在使用 SQL Alchemy(通过 Flask_sqlalchemy)将 Python 字典列表插入到 Postgres 数据库中。 其中一个表是所有唯一项目的列表(表 1),而第二个是与某个项
This source详细说明如何使用关联代理创建具有 ORM 对象值的 View 和对象。 但是,当我附加一个与数据库中现有对象匹配的值(并且所述值是唯一的或主键)时,它会创建一个冲突的对象,因此我
SQLAlchemy Core和SQLAlchemy ORM的目的有什么区别? 最佳答案 顾名思义,ORM是一个对象关系映射器:其目的是将数据库关系表示为Python对象。 核心是查询构建器。其目的是
带有ForeignKey的Column是否自动创建索引? 还是我需要手动添加index=True? some_field = Column(Integer, ForeignKey(SomeModel.
我有一个主数据库,每个客户自己的数据库连接存储在其中。 因此,每个客户端都使用2个db:main和它自己的db,必须确定其连接 对于每个http调用。我如何使用flask-sqlalchemy扩展名执
当我仅对类进行继承时,它才起作用 class User(Base): __tablename__ = ’users’ id = Column(Integer, primary_key=
从用户的角度来看,SQLAlchemy 的查询日志似乎有点过于冗长,有时甚至有点神秘: 2015-10-02 13:51:39,500 INFO sqlalchemy.engine.base.Engi
我正在尝试使用 wtforms.ext.sqlalchemy QuerySelectMultipleField 显示复选框列表,但我无法在 GET 的表单上显示模型数据。 这是我的models.py
我想为查询返回一个中继连接。使用标准的 graphene-sqlalchemy 你可以这样做: class Query(graphene.ObjectType): node = relay.N
我在 centos 7.5 虚拟机上部署了最新的 Airflow ,并将 sql_alchemy_conn 和 result_backend 更新到 postgresql 实例上的 postgres
我想将多个项目插入到一个表中,并在发生冲突时更新该表。这是我想出的以下内容 from sqlalchemy.dialects.postgresql import insert meta = MetaD
我有以下模型: class Item(Base): a = relationship() b = relationship() c = relationship() d
我有 presto 和 superset 设置。 presto 运行良好,可以通过命令访问: ./app/hadoop/setjdk8.sh;bin/presto-cli --server http:
我一直在寻找一种在 sqlalchemy 中使用 tsvector 的方法(就像 INTEGER 等其他方法一样),但到目前为止我还不清楚如何做到这一点。我读过可以使用 UserDefinedType
我正在使用 sqlalchemy(现在使用 sqlite,但稍后可能会改变)来构建一个数据库,其中插入的顺序和 rowids 很重要。我基本上有以下几点: class Message(Base):
给定一个对象,我想知道如何知道它是否是 sqlalchemy 映射模型的实例。 通常,我会使用 isinstance(obj, DeclarativeBase)。但是,在这种情况下,我没有可用的 De
我已经通读了查询文档,如果有办法从查询中获取表名,就看不到任何地方 - 例如如果我有 q = query(Users) ,我可以得到Users从 q 退出? 最佳答案 请注意,像您这样的事件简单查询可
我不确定如何定义create schema foo迁移?我的模型如下所示(我正在使用Flask-Migrate): class MyTable(db.Model): __tablename__
我是一名优秀的程序员,十分优秀!