gpt4 book ai didi

python - 使用 Pandas 和/或 Numpy 进行读/写操作的最快文件格式

转载 作者:IT老高 更新时间:2023-10-28 20:51:58 24 4
gpt4 key购买 nike

我已经使用非常大的 DataFrame 工作了一段时间,并且一直在使用 csv 格式来存储输入数据和结果。我注意到读取和写入这些文件需要花费大量时间,例如,这会大大减慢数据的批处理速度。我想知道文件格式本身是否相关。有没有更快地读取/写入 Pandas DataFrame 和/或 Numpy 数组的首选文件格式?

最佳答案

使用 HDF5。胜过编写平面文件。并且可以查询。文档是 here

这是 perf comparison vs SQL .更新以显示 SQL/HDF_fixed/HDF_table/CSV 写入和读取性能。

文档现在包含一个性能部分:

here

关于python - 使用 Pandas 和/或 Numpy 进行读/写操作的最快文件格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22941147/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com