gpt4 book ai didi

python - 加速 Pandas to_sql()?

转载 作者:太空狗 更新时间:2023-10-30 01:05:51 25 4
gpt4 key购买 nike

我有一个 1,000,000 x 50 Pandas DataFrame,我目前正在使用以下方法写入 SQL 表:

df.to_sql('my_table', con, index=False)

这需要很长时间。我已经看到关于如何在线加速此过程的各种解释,但它们似乎都不适用于 MSSQL。

  1. 如果我尝试以下方法:

    Bulk Insert A Pandas DataFrame Using SQLAlchemy

    然后我收到一个 no attribute copy_from 错误。

  2. 如果我从以下位置尝试多线程方法:

    http://techyoubaji.blogspot.com/2015/10/speed-up-pandas-tosql-with.html

    然后我得到一个 QueuePool limit of size 5 overflow 10 reach, connection timed out 错误。

是否有任何简单的方法可以加快 to_sql() 到 MSSQL 表的速度?通过 BULK COPY 或其他方法,但完全来自 Python 代码?

最佳答案

我使用 ctds 执行批量插入,使用 SQL Server 时速度要快得多。在下面的示例中,df 是 pandas DataFrame。 DataFrame 中的列序列与 mydb 的架构相同。

import ctds

conn = ctds.connect('server', user='user', password='password', database='mydb')
conn.bulk_insert('table', (df.to_records(index=False).tolist()))

关于python - 加速 Pandas to_sql()?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41554963/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com