python - peewee vs sqlalchemy 性能-6ren

python - peewee vs sqlalchemy 性能

转载作者：太空狗更新时间：2023-10-30 01:50:35

28

4

我有 2 个简单的脚本:

from sqlalchemy import create_engine, ForeignKey, Table
from sqlalchemy import Column, Date, Integer, String, DateTime, BigInteger, event
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.engine import Engine
from sqlalchemy.orm import relationship, backref, sessionmaker, scoped_session, Session

class Test(declarative_base()):
    __tablename__ = "Test"
    def __init__(self, *args, **kwargs):
        args = args[0]
        for key in args:
            setattr(self, key, args[key] )
    key = Column(String, primary_key=True)

data = []
for a in range(0,10000):
    data.append({ "key" : "key%s" % a})


engine = create_engine("sqlite:///testn", echo=False)
with engine.connect() as connection:
    Test.metadata.create_all(engine)
    session = Session(engine)
    list(map(lambda x: session.merge(Test(x)), data))
    session.commit()

结果:

real    0m15.300s
user    0m14.920s
sys     0m0.351s

第二个脚本:

from peewee import *

class Test(Model):
    key = TextField(primary_key=True,null=False)

dbname = "test"
db = SqliteDatabase(dbname)
Test._meta.database = db
data = []
for a in range(0,10000):
    data.append({ "key" : "key%s" % a })

if not Test.table_exists():
    db.create_tables([Test])
with db.atomic() as tr:
        Test.insert_many(data).upsert().execute()

结果:

real    0m3.253s
user    0m2.620s
sys     0m0.571s

为什么？

最佳答案

这种比较并不完全有效，因为发出更新插入式查询与 SQLAlchemy 的 Session.merge 有很大不同。做:

Session.merge() examines the primary key attributes of the source instance, and attempts to reconcile it with an instance of the same primary key in the session. If not found locally, it attempts to load the object from the database based on primary key, and if none can be located, creates a new instance.

在此测试用例中，这将导致对数据库进行 10,000 次加载尝试，这是非常昂贵的。

另一方面，将 peewee 与 sqlite 结合使用时 insert_many(data)和 upsert()可以导致单个查询:

INSERT OR REPLACE INTO Test (key) VALUES ('key0'), ('key1'), ...

没有要协调的 session 状态，因为 peewee 是一种与 SQLAlchemy 截然不同的 ORM，快速浏览看起来更接近 Core和 Table

在 SQLAlchemy 而不是 list(map(lambda x: session.merge(Test(x)), data)) 你可以恢复使用 Core:

session.execute(Test.__table__.insert(prefixes=['OR REPLACE']).values(data))

关于此的一个主要缺点是您必须手动为 INSERT 编写一个数据库供应商特定的前缀。这也会破坏 Session，因为它没有关于新添加行的信息或知识。

使用模型对象的批量插入是一个 little more involved with SQLAlchemy .非常简单地说，使用 ORM 是易用性和速度之间的权衡:

ORMs are basically not intended for high-performance bulk inserts - this is the whole reason SQLAlchemy offers the Core in addition to the ORM as a first-class component.

关于python - peewee vs sqlalchemy 性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36946874/

28

4

0

文章推荐：数据库设计——系统默认项和自定义用户项

文章推荐： database - 数据库表为什么叫表？

文章推荐： database - 如何在 postgres 中设置同步流复制？

文章推荐： python - 按每个子列表的第一个元素对列表列表进行排序

sqlalchemy - 如何在 SQLAlchemy 模型中使用 SQLAlchemy Utils
我正在尝试创建一个使用 UUID 作为主键的用户模型: from src.db import db # SQLAlchemy instance import sqlalchemy_utils impo
sqlalchemy - SQLAlchemy 中的别名联合
在 sqlalchemy 中，我试图合并表，然后使用 WHERE 和 ORDER_BY 创建别名有点像 SELECT * FROM ( SELECT [TABLE_ONE].[SOME_ID]
sqlalchemy - SQLAlchemy，如何向两个表中插入数据并引用外键？
我正在使用 SQL Alchemy(通过 Flask_sqlalchemy)将 Python 字典列表插入到 Postgres 数据库中。其中一个表是所有唯一项目的列表(表 1)，而第二个是与某个项
sqlalchemy - 关联代理 SQLAlchemy
This source详细说明如何使用关联代理创建具有 ORM 对象值的 View 和对象。但是，当我附加一个与数据库中现有对象匹配的值(并且所述值是唯一的或主键)时，它会创建一个冲突的对象，因此我
sqlalchemy - sqlalchemy core和ORM有什么区别？
SQLAlchemy Core和SQLAlchemy ORM的目的有什么区别？最佳答案顾名思义，ORM是一个对象关系映射器：其目的是将数据库关系表示为Python对象。核心是查询构建器。其目的是
sqlalchemy - SQLAlchemy:具有ForeignKey的列是否自动创建索引？
带有ForeignKey的Column是否自动创建索引？还是我需要手动添加index=True？ some_field = Column(Integer, ForeignKey(SomeModel.
sqlalchemy - 带动态数据库连接的flask-sqlalchemy
我有一个主数据库，每个客户自己的数据库连接存储在其中。因此，每个客户端都使用2个db:main和它自己的db，必须确定其连接对于每个http调用。我如何使用flask-sqlalchemy扩展名执
sqlalchemy - sqlalchemy:Base如何知道我已经定义了映射到它的类？
当我仅对类进行继承时，它才起作用 class User(Base): __tablename__ = ’users’ id = Column(Integer, primary_key=
sqlalchemy - SQLAlchemy 中的友好查询日志记录
从用户的角度来看，SQLAlchemy 的查询日志似乎有点过于冗长，有时甚至有点神秘: 2015-10-02 13:51:39,500 INFO sqlalchemy.engine.base.Engi
sqlalchemy - 如何使用 SQLAlchemy 多对多关系实例化 wtforms.ext.sqlalchemy.fields.QuerySelectMultipleField
我正在尝试使用 wtforms.ext.sqlalchemy QuerySelectMultipleField 显示复选框列表，但我无法在 GET 的表单上显示模型数据。这是我的models.py
sqlalchemy - 您如何编写一个返回 SQLAlchemy 作为中继连接的解析器？
我想为查询返回一个中继连接。使用标准的 graphene-sqlalchemy 你可以这样做: class Query(graphene.ObjectType): node = relay.N
sqlalchemy - Airflow + sqlalchemy 与元数据数据库的短暂连接
我在 centos 7.5 虚拟机上部署了最新的 Airflow ，并将 sql_alchemy_conn 和 result_backend 更新到 postgresql 实例上的 postgres
sqlalchemy - 批量插入 sqlalchemy 核心与冲突更新
我想将多个项目插入到一个表中，并在发生冲突时更新该表。这是我想出的以下内容 from sqlalchemy.dialects.postgresql import insert meta = MetaD
sqlalchemy - 如何急切地加载 SQLAlchemy 中的所有关系
我有以下模型: class Item(Base): a = relationship() b = relationship() c = relationship() d
sqlalchemy - 如何在airbnb数据可视化工具超集中添加presto SQLalchemy URI进行连接
我有 presto 和 superset 设置。 presto 运行良好，可以通过命令访问: ./app/hadoop/setjdk8.sh;bin/presto-cli --server http:
sqlalchemy - sqlalchemy 中的 tsvector
我一直在寻找一种在 sqlalchemy 中使用 tsvector 的方法(就像 INTEGER 等其他方法一样)，但到目前为止我还不清楚如何做到这一点。我读过可以使用 UserDefinedType
sqlalchemy - sqlalchemy 是否保留多对一/多对多关系中的顺序？
我正在使用 sqlalchemy(现在使用 sqlite，但稍后可能会改变)来构建一个数据库，其中插入的顺序和 rowids 很重要。我基本上有以下几点: class Message(Base):
sqlalchemy - 检查对象是否是 sqlalchemy 模型实例
给定一个对象，我想知道如何知道它是否是 sqlalchemy 映射模型的实例。通常，我会使用 isinstance(obj, DeclarativeBase)。但是，在这种情况下，我没有可用的 De
sqlalchemy - 如何从 sqlalchemy 查询中获取表名
我已经通读了查询文档，如果有办法从查询中获取表名，就看不到任何地方 - 例如如果我有 q = query(Users) ，我可以得到Users从 q 退出? 最佳答案请注意，像您这样的事件简单查询可
sqlalchemy - SQLAlchemy + Alembic:创建架构迁移
我不确定如何定义create schema foo迁移？我的模型如下所示（我正在使用Flask-Migrate）： class MyTable(db.Model): __tablename__

首页

博学

6Ren·AI

商城

python - peewee vs sqlalchemy 性能