python - Pandas 在 to_sql 之后让空闲的 Postgres 连接保持打开状态？-6ren

python - Pandas 在 to_sql 之后让空闲的 Postgres 连接保持打开状态？

转载作者：行者123 更新时间：2023-11-29 12:40:04

26

4

我正在用 Pandas 和 Postgres 做很多 ETL。我有大量空闲连接，其中许多标有 COMMIT 和 ROLLBACK，我不确定如何防止长时间处于空闲状态而不是关闭。我用来写入数据库的主要代码是使用pandas to_sql:

def write_data_frame(self, data_frame, table_name):
    engine = create_engine(self.engine_string)
    data_frame.to_sql(name=table_name, con=engine, if_exists='append', index=False)

我知道这绝对不是 PostgreSQL 的最佳实践，我应该做一些事情，比如将参数传递给存储过程或函数或其他东西，但这是我们设置从非 Postgres 数据库/数据源获取数据帧的方式，并且上传到 Postgres。

我的 pgAdmin 看起来像这样:

有人可以指出我 future 如何避免这么多空闲连接的正确方向吗？我们的一些数据库连接是长期存在的，因为它们是连续的“批处理”过程。但似乎一些一次性事件使连接处于打开和空闲状态。

最佳答案

一次性使用引擎可能对您来说并不理想。如果可能，您可以使引擎成为该类的成员并将其称为 self.engine。

另一种选择是显式处理引擎。

def write_data_frame(self, data_frame, table_name):
    engine = create_engine(self.engine_string)
    data_frame.to_sql(name=table_name, con=engine, if_exists='append', index=False)
    engine.dispose()

如 the docs 中所述,

This has the effect of fully closing all currently checked in database connections. Connections that are still checked out will not be closed, however they will no longer be associated with this Engine, so when they are closed individually, eventually the Pool which they are associated with will be garbage collected and they will be closed out fully, if not already closed on checkin.

这也可能是 try...except...finally block 的一个很好的用例，因为 .dispose 只会在前面的代码没有执行时被调用错误。

我更愿意建议您像这样传递连接:

with engine.connect() as connection:
    data_frame.to_sql(..., con=connection)

但是 to_sql 文档表明你不能那样做，他们只会接受一个 engine

关于python - Pandas 在 to_sql 之后让空闲的 Postgres 连接保持打开状态？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54831495/

26

4

0

文章推荐： ios - 在 iOS 7 中将视频播放器旋转到横向模式

文章推荐： sql - 使用 FIRST_VALUE 而不包括 group by 中的内部列

文章推荐： mysql - 计算日期范围内每个工作日的工作时间

Pandas to_sql 使索引唯一
我已经阅读了有关不向数据库添加重复记录的 Pandas to_sql 解决方案。我正在处理日志的 csv 文件，每次我上传一个新的日志文件时，我都会读取数据并使用 Pandas 创建一个新的数据框进行
mysqldb中带有sqlAlchemy重复项的 Pandas to_sql
我正在将PANDAS与SQLAlchemy一起使用DataFrame.to_sql写入MYSQL DB。我喜欢打开'append' --> df.to_sql(con=con, name='table
python - to_sql 的数据透视表
我有一个看起来像这样的数据框 id_1 id_2 id_3 ... date_1 1 3 4 date_2 4
pandas.to_sql 将新列添加到现有表中，自动添加新列？
我想将数据帧写入现有的 sqlite(或 mysql)表，有时数据帧将包含数据库中尚不存在的新列。我需要做什么才能避免抛出错误？有没有办法告诉 pandas 或 sqlalchemy 使用潜在的新列自
django - Django中的 Pandas to_sql
我正在尝试使用Django的db连接变量将pandas数据帧插入Postgres数据库。我使用的代码是 df.to_sql('forecast',connection,if_exists='appen
python - Pandas to_sql 参数和性能
我目前正在尝试稍微调整一些脚本的性能，似乎瓶颈始终是使用 pandas to_sql 函数实际插入数据库(=MSSQL)。造成这种情况的一个因素是 mssql 的参数限制为 2100。我与 sql
python - Pandas to_sql 更改数据库表中的数据类型
有人经历过这种情况吗？我有一个包含“int”和“varchar”列的表 - 一个报告时间表。我正在尝试使用 python 程序将扩展名为“.xls”的 Excel 文件导入到该表中。我正在使用 p
python - Pandas to_sql 不创建文件
我正在尝试将 pandas 数据框保存为 SQL 文件我按照文档进行了尝试 from sqlalchemy import create_engine engine = create_engine('
python - DataFrame to_sql 使用错误的字符集进行替换
Panda 的 to_sql() 和 if_exists='replace' 为我的表设置了错误的字符集。为了将多个 csv 复制到 mysql 并忽略行上的错误(如重复错误)，我首先将 csv 读取
python - pandas to_sql 方法给出日期列错误
我有一个如下所示的数据框: df = pd.DataFrame(index= pd.date_range('2014-01-01', periods=10)) df['date'] = df.inde
python - Pandas to_sql 右截断错误
我正在尝试使用 Pandas to_sql 将 .csv 文件中的数据插入到 mssql 数据库中。不管我怎么看，我都会遇到这个错误: pyodbc.DataError: ('String data,
python - Pandas to_sql 插入忽略
我想不断将数据帧行添加到 MySQL 数据库中，避免任何重复的条目进入 MySQL。我目前通过使用 df.apply() 遍历每一行并调用 MySQL insert ignore(duplicate
python - Pandas to_sql() 更新数据库中的唯一值？
如何使用 df.to_sql(if_exists = 'append') 仅附加数据框和数据库之间的唯一值。换句话说，我想评估 DF 和 DB 之间的重复项，并在写入数据库之前删除这些重复项。这个有
python - Pandas to_sql 中行的排序
我有一个订购的 Pandas Dataframe。 a0 b0 c0 d0 370025442 370020440 370020436
Python Pandas to_sql 'append'
我正在尝试使用 Python 的 pandas to_sql 命令将月度数据发送到 MySQL 数据库。我的程序一次运行一个月的数据，我想将新数据附加到现有数据库中。然而，Python 给我一个错误:
python - pandas to_sql 截断了我的数据
我正在使用 df.to_sql(con=con_mysql, name='testdata', if_exists='replace', flavor='mysql') 将数据框导出到 mysql。但
python - 加速 Pandas to_sql()？
我有一个 1,000,000 x 50 Pandas DataFrame，我目前正在使用以下方法写入 SQL 表: df.to_sql('my_table', con, index=False) 这需
python - Pandas to_sql 设置列类型
我有一个字符串格式的数字列，我想将它作为 float 发送到 PostresSQL。如何确保 SQLAlchemy 将此列设置为 float ？ (请注意，列中可能是 NaN)。这是代码 import
python - Pandas to_sql 没有在我的表中插入任何数据
我想在我创建的表格中插入一些数据。我有一个如下所示的数据框: 我创建了一个表: create table online.ds_attribution_probabilities ( attributi
python - Pandas to_sql() 插入索引
我正在使用 Pandas 0.18.1，在摆弄这段代码时， import pd def getIndividualDf(item): var1 = [] # ... populate

首页

博学

6Ren·AI

商城

python - Pandas 在 to_sql 之后让空闲的 Postgres 连接保持打开状态？