python - 我可以让 SQLAlchemy 在不重复完整的原始查询的情况下进行子查询预加载吗？-6ren

python - 我可以让 SQLAlchemy 在不重复完整的原始查询的情况下进行子查询预加载吗？

转载作者：太空狗更新时间：2023-10-29 20:24:11

24

4

假设我们有这样的原始生成查询:

SELECT company.x AS company_x, ...
FROM company
LEFT OUTER JOIN acc ON acc.id = company.acc
LEFT OUTER JOIN usercomp_links ON company.id = usercomp_links.pid
LEFT OUTER JOIN usergro_links ON acc.id = usergro_links.pid
WHERE usergro_links.eid = %s OR usercomp_links.eid = %s

如果我们向其中添加 .options(subqueryload(Company.childs))，我们将得到:

SELECT company.x AS company_x, ..., anon_1.company_id AS anon_1_company_id
FROM (
    SELECT company.id AS company_id
    FROM company
    LEFT OUTER JOIN acc ON acc.id = company.acc
    LEFT OUTER JOIN usercomp_links ON company.id = usercomp_links.pid
    LEFT OUTER JOIN usergro_links ON acc.id = usergro_links.pid
    WHERE usergro_links.eid = %s OR usercomp_links.eid = %s) AS anon_1
INNER JOIN acel_links AS acel_links_1 ON anon_1.company_id = acel_links_1.eid
INNER JOIN company ON company.id = acel_links_1.pid ORDER BY anon_1.company_id

这很慢。如果我将从第一个查询中获取公司 ID，并手动加载所有子公司，与我们在这种情况下获得的相比，它将快得惊人。

我已经阅读了文档，查看了代码，但不知道我是否可以告诉 sqlalchemy 只从第一个查询的结果中获取 ID，并在单独的、相对简单的查询中加载子项。我不依赖这个示例——当 sqlalchemy 无法加载构造的查询时，我遇到了更多更困难的情况。为什么要从第一个查询开始再做所有这些工作？

所以有人知道如何在没有自动构造的“从连接到连接”样式的情况下进行预加载吗？

最佳答案

更新:“select in”策略现已在 SQLAlchemy 中实现(自 v 1.2 起):参见 Select IN loading在文档中。

TLDR:

我认为应该尽可能使用joinedload策略，因为它比其他策略更有效，包括问题策略中建议的使用“IN”语句加载相关数据。

“IN”策略可以很容易地在 SQLAlchemy 的“外部”实现(参见下面的代码)，并且作为新的加载策略实现它可能不应该很复杂(因为逻辑上它类似于现有的 subqueryload 策略)。

完整版:

我从一个简单的实验开始，看看不同策略产生的查询

实验的完整源代码是on Github .

我的模型是这样的:

class Author(ModelBase):
    __tablename__ = 'authors'
    id = Column(Integer, primary_key=True, nullable=False)
    name = Column(String(255))


class Book(ModelBase):
    __tablename__ = 'books'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    author_id = Column(Integer, ForeignKey('authors.id'))
    author = relationship(
        'Author', backref=backref('books'))

现在，测试，首先是惰性加载:

books = session.query(Book).all()
print books[0].author.name
session.commit()

输出(清理后):

-------------Lazy--------------
sqlalchemy.engine.base.Engine:
SELECT
  books.id AS books_id, books.name AS books_name, books.author_id AS books_author_id
FROM books

SELECT
  authors.id AS authors_id, authors.name AS authors_name
FROM authors
WHERE authors.id = ?
INFO:sqlalchemy.engine.base.Engine:(1,)
author1

正如预期的那样，延迟加载会在每次访问一位作者时运行一个查询来获取书籍和一个查询。

子查询加载:

books = session.query(Book).options(subqueryload(Book.author)).all()
print books[0].author.name
session.commit()

-------------Subquery----------
SELECT
  books.id AS books_id, books.name AS books_name, books.author_id AS books_author_id
FROM books

SELECT
  authors.id AS authors_id, authors.name AS authors_name,
  anon_1.books_author_id AS anon_1_books_author_id
FROM (
  SELECT DISTINCT books.author_id AS books_author_id
  FROM books) AS anon_1
JOIN authors
  ON authors.id = anon_1.books_author_id
ORDER BY anon_1.books_author_id
author1

对于子查询，我们有两个查询，一个是获取书籍，另一个是使用子查询获取作者。

加入加载:

books = session.query(Book).options(joinedload(Book.author)).all()
print books[0].author.name
session.commit()

-------------Joined------------
SELECT
  books.id AS books_id, books.name AS books_name,
  books.author_id AS books_author_id,
  authors_1.id AS authors_1_id, authors_1.name AS authors_1_name
FROM books
LEFT OUTER JOIN authors AS authors_1 ON authors_1.id = books.author_id
author1

联合策略只运行一个查询来获取书籍和作者。

立即加载:

books = session.query(Book).options(immediateload(Book.author)).all()
print books[0].author.name
session.commit()

-------------Immediate---------
SELECT
   books.id AS books_id, books.name AS books_name, books.author_id AS books_author_id
FROM books

SELECT
  authors.id AS authors_id, authors.name AS authors_name
FROM authors
WHERE authors.id = ?
INFO:sqlalchemy.engine.base.Engine:(1,)

SELECT authors.id AS authors_id, authors.name AS authors_name
FROM authors
WHERE authors.id = ?
INFO:sqlalchemy.engine.base.Engine:(2,)

author1

immediate 策略使用第一个查询加载书籍，然后，当我们尝试访问关系时，通过对每个相关记录的单独查询获取所有相关数据。

看起来“joinedload()”在大多数情况下应该是最有效的(amd 比“IN”策略更有效)——我们只需通过一次查询获取所有数据。

现在，让我们尝试在 SQL Alchemy 之外实现 IN 策略:

print '-------------IN----------------'
books = session.query(Book).all()
ids = set()
for b in books:
    ids.add(b.author_id)
authors = session.query(Author).filter(Author.id.in_(ids)).all()
print books[0].author.name
print books[1].author.name
print books[2].author.name
print books[3].author.name

输出:

-------------IN----------------
SELECT
  books.id AS books_id, books.name AS books_name, books.author_id AS books_author_id
FROM books

SELECT authors.id AS authors_id, authors.name AS authors_name
FROM authors
WHERE authors.id IN (?, ?)
INFO:sqlalchemy.engine.base.Engine:(1, 2)

author1
author1
author2
author2

正如我们所见，它运行了两个查询，然后我们可以访问所有作者。

请注意，我们没有明确地将作者加入书籍，但当我们尝试通过书籍访问作者时它仍然有效，因为 SQLAlchemy 在内部身份映射中找到作者记录并且不运行额外的数据库查询。

类似于上面的“IN”策略代码可以概括为可以与任何模型/关系一起使用的函数。也许，“IN”策略作为一个新的 SQLAlchemy 策略应该相对容易实现，它类似于现有的 subqueryloading - 它也应该运行第二个查询来获取相关数据。

关于python - 我可以让 SQLAlchemy 在不重复完整的原始查询的情况下进行子查询预加载吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26704076/

24

4

0

文章推荐： python - 忽略 NaN 的 Pandas 聚合

文章推荐： C++ Windows fstream 区分大小写

文章推荐： c++ - 为什么 string::resize 的复杂度是线性的？

sqlalchemy - 如何在 SQLAlchemy 模型中使用 SQLAlchemy Utils
我正在尝试创建一个使用 UUID 作为主键的用户模型: from src.db import db # SQLAlchemy instance import sqlalchemy_utils impo
sqlalchemy - SQLAlchemy 中的别名联合
在 sqlalchemy 中，我试图合并表，然后使用 WHERE 和 ORDER_BY 创建别名有点像 SELECT * FROM ( SELECT [TABLE_ONE].[SOME_ID]
sqlalchemy - SQLAlchemy，如何向两个表中插入数据并引用外键？
我正在使用 SQL Alchemy(通过 Flask_sqlalchemy)将 Python 字典列表插入到 Postgres 数据库中。其中一个表是所有唯一项目的列表(表 1)，而第二个是与某个项
sqlalchemy - 关联代理 SQLAlchemy
This source详细说明如何使用关联代理创建具有 ORM 对象值的 View 和对象。但是，当我附加一个与数据库中现有对象匹配的值(并且所述值是唯一的或主键)时，它会创建一个冲突的对象，因此我
sqlalchemy - sqlalchemy core和ORM有什么区别？
SQLAlchemy Core和SQLAlchemy ORM的目的有什么区别？最佳答案顾名思义，ORM是一个对象关系映射器：其目的是将数据库关系表示为Python对象。核心是查询构建器。其目的是
sqlalchemy - SQLAlchemy:具有ForeignKey的列是否自动创建索引？
带有ForeignKey的Column是否自动创建索引？还是我需要手动添加index=True？ some_field = Column(Integer, ForeignKey(SomeModel.
sqlalchemy - 带动态数据库连接的flask-sqlalchemy
我有一个主数据库，每个客户自己的数据库连接存储在其中。因此，每个客户端都使用2个db:main和它自己的db，必须确定其连接对于每个http调用。我如何使用flask-sqlalchemy扩展名执
sqlalchemy - sqlalchemy:Base如何知道我已经定义了映射到它的类？
当我仅对类进行继承时，它才起作用 class User(Base): __tablename__ = ’users’ id = Column(Integer, primary_key=
sqlalchemy - SQLAlchemy 中的友好查询日志记录
从用户的角度来看，SQLAlchemy 的查询日志似乎有点过于冗长，有时甚至有点神秘: 2015-10-02 13:51:39,500 INFO sqlalchemy.engine.base.Engi
sqlalchemy - 如何使用 SQLAlchemy 多对多关系实例化 wtforms.ext.sqlalchemy.fields.QuerySelectMultipleField
我正在尝试使用 wtforms.ext.sqlalchemy QuerySelectMultipleField 显示复选框列表，但我无法在 GET 的表单上显示模型数据。这是我的models.py
sqlalchemy - 您如何编写一个返回 SQLAlchemy 作为中继连接的解析器？
我想为查询返回一个中继连接。使用标准的 graphene-sqlalchemy 你可以这样做: class Query(graphene.ObjectType): node = relay.N
sqlalchemy - Airflow + sqlalchemy 与元数据数据库的短暂连接
我在 centos 7.5 虚拟机上部署了最新的 Airflow ，并将 sql_alchemy_conn 和 result_backend 更新到 postgresql 实例上的 postgres
sqlalchemy - 批量插入 sqlalchemy 核心与冲突更新
我想将多个项目插入到一个表中，并在发生冲突时更新该表。这是我想出的以下内容 from sqlalchemy.dialects.postgresql import insert meta = MetaD
sqlalchemy - 如何急切地加载 SQLAlchemy 中的所有关系
我有以下模型: class Item(Base): a = relationship() b = relationship() c = relationship() d
sqlalchemy - 如何在airbnb数据可视化工具超集中添加presto SQLalchemy URI进行连接
我有 presto 和 superset 设置。 presto 运行良好，可以通过命令访问: ./app/hadoop/setjdk8.sh;bin/presto-cli --server http:
sqlalchemy - sqlalchemy 中的 tsvector
我一直在寻找一种在 sqlalchemy 中使用 tsvector 的方法(就像 INTEGER 等其他方法一样)，但到目前为止我还不清楚如何做到这一点。我读过可以使用 UserDefinedType
sqlalchemy - sqlalchemy 是否保留多对一/多对多关系中的顺序？
我正在使用 sqlalchemy(现在使用 sqlite，但稍后可能会改变)来构建一个数据库，其中插入的顺序和 rowids 很重要。我基本上有以下几点: class Message(Base):
sqlalchemy - 检查对象是否是 sqlalchemy 模型实例
给定一个对象，我想知道如何知道它是否是 sqlalchemy 映射模型的实例。通常，我会使用 isinstance(obj, DeclarativeBase)。但是，在这种情况下，我没有可用的 De
sqlalchemy - 如何从 sqlalchemy 查询中获取表名
我已经通读了查询文档，如果有办法从查询中获取表名，就看不到任何地方 - 例如如果我有 q = query(Users) ，我可以得到Users从 q 退出? 最佳答案请注意，像您这样的事件简单查询可
sqlalchemy - SQLAlchemy + Alembic:创建架构迁移
我不确定如何定义create schema foo迁移？我的模型如下所示（我正在使用Flask-Migrate）： class MyTable(db.Model): __tablename__

首页

博学

6Ren·AI

商城

python - 我可以让 SQLAlchemy 在不重复完整的原始查询的情况下进行子查询预加载吗？