gpt4 book ai didi

python - 如何估计 Pandas 的 DataFrame 需要多少内存?

转载 作者:IT老高 更新时间:2023-10-28 21:08:45 36 4
gpt4 key购买 nike

我一直在想...如果我正在将一个 400MB 的 csv 文件读入 pandas 数据帧(使用 read_csv 或 read_table),有没有办法猜测这需要多少内存?只是想更好地了解数据帧和内存...

最佳答案

df.memory_usage()将返回每列占用多少字节:

>>> df.memory_usage()

Row_ID 20906600
Household_ID 20906600
Vehicle 20906600
Calendar_Year 20906600
Model_Year 20906600
...

要包含索引,请传递 index=True

所以要获得整体内存消耗:

>>> df.memory_usage(index=True).sum()
731731000

此外,传递 deep=True 将启用更准确的内存使用情况报告,该报告说明了所包含对象的全部使用情况。

这是因为如果 deep=False(默认情况),内存使用不包括不是数组组件的元素消耗的内存。

关于python - 如何估计 Pandas 的 DataFrame 需要多少内存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18089667/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com