gpt4 book ai didi

python - 使用 python 将巨大的 XLS 数据加载到 Oracle 中

转载 作者:太空宇宙 更新时间:2023-11-03 17:42:24 25 4
gpt4 key购买 nike

我有一个超过 300 万条记录的 XLS 文件,我需要使用 python 2.7 将其转储到 Oracle 12C DB(直接转储)中。

我正在使用 Cx_Oracle python 包建立与 Oracle 的连接,但读取和转储 XLS(使用 openpyxl pckg)非常慢,并且数千/百万条记录的性能会下降。

从脚本编写的角度来看,使用两种方式 -

  1. 我尝试过批量加载,方法是读取数组中的所有值,然后使用游标准备(带有绑定(bind)变量)和游标 fetchmany 转储它。这不适用于大量数据。

  2. 在获取数据时迭代加载数据。即使这种方式也存在性能问题。

我可以部署哪些选项和技术/包作为将如此大量的数据从 XLS 加载到 Oracle DB 的最佳实践?是否建议通过脚本加载如此大量的数据,或者我是否必须使用 ETL 工具?截至目前,我只能通过 python 脚本进行选择,所以请回答前者

最佳答案

如果可以将 Excel 文件导出为 CSV,那么您只需使用 sqlldr 将文件加载到数据库中

关于python - 使用 python 将巨大的 XLS 数据加载到 Oracle 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30324370/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com