gpt4 book ai didi

python - 使用 Pandas 数据框的内存泄漏

转载 作者:太空狗 更新时间:2023-10-29 20:59:13 24 4
gpt4 key购买 nike

我在多线程代码中使用 pandas.DataFrame(实际上是 DataFrame 的自定义子类,称为 Sound)。我注意到我有内存泄漏,因为我的程序的内存使用量逐渐增加超过 1000 万,最终达到大约 100% 的计算机内存并崩溃。

我用了objgraph尝试跟踪此泄漏,并发现 MyDataFrame 的实例计数一直在上升,而它不应该:其 run 方法中的每个线程都创建一个例如,进行一些计算,将结果保存在文件中并退出...因此不应保留任何引用。

使用objgraph我发现内存中的所有数据帧都有一个相似的引用图:

enter image description here

我不知道这是否正常……看起来这就是将我的对象保存在内存中的原因。任何想法、建议、见解?

最佳答案

已确认索引基础结构中存在某种内存泄漏。 不是上面的引用图造成的。让我们将讨论转移到 GitHub(SO 用于问答):

https://github.com/pydata/pandas/issues/2659

编辑:这实际上看起来根本不是内存泄漏,但可能与操作系统内存分配问题有关。请查看 github 问题以获取更多信息

关于python - 使用 Pandas 数据框的内存泄漏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14224068/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com