gpt4 book ai didi

python - 高效地将大型 Pandas 数据帧写入磁盘

转载 作者:太空狗 更新时间:2023-10-30 00:45:19 24 4
gpt4 key购买 nike

我正在尝试找到使用 Python/Pandas 高效地将大型数据帧 (250MB+) 写入磁盘和从磁盘写入的最佳方法。 Python for Data Analysis 中的所有方法我都试过了,但是性能非常令人失望。

这是探索将我们当前的分析/数据管理环境从 Stata 迁移到 Python 的更大项目的一部分。当我将测试中的读/写时间与使用 Stata 获得的读/写时间进行比较时,Python 和 Pandas 通常花费的时间是后者的 20 多倍。

我强烈怀疑我是问题所在,而不是 Python 或 Pandas。

有什么建议吗?

最佳答案

使用 HDFStore 是您最好的选择(本书中没有涉及太多内容,并且已经进行了很多更改)。您会发现性能比任何其他序列化方法都要好得多。

关于python - 高效地将大型 Pandas 数据帧写入磁盘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19639596/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com