对象和进程的Python内存消耗-6ren

对象和进程的Python内存消耗

转载作者：太空狗更新时间：2023-10-29 21:45:11

27

4

我写了下面的代码:

from hurry.size import size
from pysize import get_zise
import os
import psutil
def load_objects():
   process = psutil.Process(os.getpid())
   print "start method"
   process = psutil.Process(os.getpid())
   print "process consumes " + size(process.memory_info().rss)
   objects = make_a_call()
   print "total size of objects is " + (get_size(objects))
   print "process consumes " + size(process.memory_info().rss)
   print "exit method"

def main():
    process = psutil.Process(os.getpid())
    print "process consumes " + size(process.memory_info().rss)
    load_objects()
    print "process consumes " + size(process.memory_info().rss)

get_size() 使用 this 返回对象的内存消耗代码。

我得到以下打印件:

process consumes 21M
start method
total size of objects is 20M
process consumes 29M
exit method
process consumes 29M

如果进程仅多消耗 8M，对象为何消耗 20M？
如果我退出一个方法，内存不应该减少回 21，因为垃圾收集器将清除消耗的内存吗？

最佳答案

这很可能是因为您的代码不准确。

这是一个具有相同问题的完整工作(python 2.7)示例(为了简单起见，我稍微更新了原始代码)

from hurry.filesize import size
from pysize import get_size
import os
import psutil


def make_a_call():
    return range(1000000)

def load_objects():
    process = psutil.Process(os.getpid())
    print "start method"
    process = psutil.Process(os.getpid())
    print"process consumes ", size(process.memory_info().rss)
    objects = make_a_call()
    # FIXME
    print "total size of objects is ", size(get_size(objects))
    print "process consumes ", size(process.memory_info().rss)
    print "exit method"

def main():
    process = psutil.Process(os.getpid())
    print "process consumes " + size(process.memory_info().rss)
    load_objects()
    print "process consumes " + size(process.memory_info().rss)


main()

这是输出:

process consumes 7M
start method
process consumes  7M
total size of objects is  30M
process consumes  124M
exit method
process consumes 124M

区别是~100Mb

这是代码的固定版本:

from hurry.filesize import size
from pysize import get_size
import os
import psutil


def make_a_call():
    return range(1000000)

def load_objects():
    process = psutil.Process(os.getpid())
    print "start method"
    process = psutil.Process(os.getpid())
    print"process consumes ", size(process.memory_info().rss)
    objects = make_a_call()
    print "process consumes ", size(process.memory_info().rss)
    print "total size of objects is ", size(get_size(objects))
    print "exit method"

def main():
    process = psutil.Process(os.getpid())
    print "process consumes " + size(process.memory_info().rss)
    load_objects()
    print "process consumes " + size(process.memory_info().rss)


main()

这是更新后的输出:

process consumes 7M
start method
process consumes  7M
process consumes  38M
total size of objects is  30M
exit method
process consumes 124M

你看出区别了吗？您在测量最终进程大小之前计算对象大小，这会导致额外的内存消耗。让我们检查它为什么会发生 - 这是来源 https://github.com/bosswissam/pysize/blob/master/pysize.py :

import sys
import inspect

def get_size(obj, seen=None):
    """Recursively finds size of objects in bytes"""
    size = sys.getsizeof(obj)
    if seen is None:
        seen = set()
    obj_id = id(obj)
    if obj_id in seen:
        return 0
    # Important mark as seen *before* entering recursion to gracefully handle
    # self-referential objects
    seen.add(obj_id)
    if hasattr(obj, '__dict__'):
        for cls in obj.__class__.__mro__:
            if '__dict__' in cls.__dict__:
                d = cls.__dict__['__dict__']
                if inspect.isgetsetdescriptor(d) or inspect.ismemberdescriptor(d):
                    size += get_size(obj.__dict__, seen)
                break
    if isinstance(obj, dict):
        size += sum((get_size(v, seen) for v in obj.values()))
        size += sum((get_size(k, seen) for k in obj.keys()))
    elif hasattr(obj, '__iter__') and not isinstance(obj, (str, bytes, bytearray)):
        size += sum((get_size(i, seen) for i in obj))
    return size

这里发生了很多事情!最值得注意的是，它将所有它看到的对象保存在一个集合中以解决循环引用。如果您删除该行，则在任何一种情况下都不会占用那么多内存。

首先，此行为在很大程度上取决于您使用的是 CPython 还是其他软件。对于 CPython，这可能会发生，因为并不总是能够立即将内存返回给操作系统。

这是一个很好的article关于这个问题，引用:

If you create a large object and delete it again, Python has probably released the memory, but the memory allocators involved don’t necessarily return the memory to the operating system, so it may look as if the Python process uses a lot more virtual memory than it actually uses.

关于对象和进程的Python内存消耗，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47908281/

27

4

0

文章推荐： c++ - 停止回车出现在 stringstream 中

文章推荐： c# - 是否有太多 WCF 服务这样的事情？

文章推荐： python - 神经网络 : estimating sine wave frequency

文章推荐： c++ - PCL:如何更新 pcl::visualizer 中的法线云？

spring - 消耗 HATEOAS 资源
我有一个简单的 HATEOAS 使用构建的提供程序 Spring 这为我提供了以下资源: { "_links" : { "self" : { "href" : "http:/
Clojure 函数体中不同位置的惰性 seq 消耗
这里是 Clojure 初学者，不确定问题中的术语是否正确。我正在使用 clj-webdriver 出租车 API 构建网络抓取工具。它需要从多个站点抓取数据。以下实际上不是项目中的代码，但我已经对
c++ - 如何通过固定线程循环周期最小化 CPU 消耗
我使用pthread lib 2.8，操作系统内核是arm上的Linux 2.6.37。在我的程序中，线程 A 使用 pthread 接口(interface)将调度优先级设置为 sched_get_
c++ - 打开文件时的 RAM 消耗
我有一个大约 400MB 的二进制文件，我想将其转换为 CSV 格式。输出的 CSV 文件将约为 1GB(根据我的计算)。我读取二进制文件并将其存储在一个结构数组中(其他处理也需要)，当用户想要将其
c++ - 串行端口线程的 CPU 消耗
我在编写我的专业应用程序时遇到一个串口线程问题。我有cpu消耗。当我在我的项目中添加 SerialCtrl.h(来自项目 SerialCtrl http://www.codeproject.com/A
c - 由于可变排序而导致不同的 RAM 消耗
总结:似乎 c 代码的 RAM 消耗取决于变量排序。有没有办法自动优化？更长的版本:在这里，我粘贴了两个版本的代码，它们仅在变量排序方面有所不同。版本 1: static unsigned lon
C#:使用位图时如何减少内存和 CPU 消耗？
我有一个处理图像编辑(裁剪和调整大小)的 Windows 应用程序项目。不幸的是，这些图像处理会消耗大量内存和 CPU 资源(很容易达到 600MB 或 50% cpu)，而且它只是裁剪和调整大小 2
c++ - 为什么在类实例化期间没有 CPU 消耗？
我创建了一个实例化类 10 亿次的循环，并且非常惊讶地看到它在 0 毫秒内运行并且根据 Windows 任务管理器没有消耗 CPU 时间。正如您从下面的代码中看到的那样，我显然没有对默认构造函数执行
java - 用户名的正则表达式会增加 CPU 消耗
我们有以下用户名验证规则: 用户名可以包含字母数字字符用户名可以有下划线、连字符或句号现在假设用户名是 ASCII 用户名不能以句点开头或结尾用户名不能开始、结束或有任何空格我们有以下相同的正
c# - 列出所有进程及其当前内存和 CPU 消耗？
如何获取 C# 中所有进程的列表，然后获取每个进程的当前内存和 CPU 消耗？非常感谢示例代码。最佳答案 Process class有一个 GetProcesses 方法，可以让您枚举正在运行的进
c - 如何限制进程中的 RAM 消耗？
如何从 linux 2.6.32 机器上的源代码中限制 C 程序的物理内存消耗？我需要确定系统使用的页面替换算法的类型。问题是，如果不限制一个进程在内存中可以拥有的页面数量，就很难分析页面错误的模
linux - 跟踪线程内存和 CPU 消耗
我正在编写一个 Linux 应用程序，它观察其他应用程序并跟踪资源消耗。我计划使用 Java，但编程语言对我来说并不重要。目标很重要，所以我可以切换到另一种技术或使用模块。我的应用程序将任何选定的第三
Java，JCheckbox - 消耗/阻止所有事件，但仍然启用
我有一个图标，旁边有一个复选框，包含在一个面板中。面板有悬停效果，点击面板时想选中框。我想使用或阻止复选框的所有事件，仅以编程方式选择它。我希望该框在屏幕上显示为“已启用”，而“在幕后”几乎不起作用
javascript - 消耗 angular.js 剩余请愿书的所有记录
我正在使用服务 REST，它当前有 5025 条记录，但当我使用该服务时，只出现 1,000 条记录。我可以做什么来完全消耗所有记录？这是我的代码示例: $http({ method:
Azure 存储帐户 - 跟踪 SAS 消耗
我已经搜索了几个小时但没有成功，是否可以跟踪 Blob 容器上 SAS 凭据的消耗情况？我将向几个客户提供 SAS 凭证，并且我希望能够跟踪他们的 SAS 使用情况(操作次数、带宽使用情况...)
azure - Azure 中的意外 RAM 消耗
我创建了具有 1.75 GB RAM 的 B1 应用服务计划。我还创建了一个应用程序服务并向其部署了 docker 镜像。现在我停止了 docker 镜像，它的状态已停止，并且它是该应用程序服务计划中
azure - Hololens 项目 Azure 消耗
与我们的合作伙伴一起为我们的客户(一家售后汽车零部件零售商)开发一个项目，他们利用 AR 和 VR 做了很多很酷的事情。我们的想法是使用 Hololens 并尝试帮助我们的客户在其大型仓库中进行物流操
haskell - Haskell 和流融合不断增加 CPU 消耗
这是一个简短的 Haskell 程序，可以生成 440 Hz 的声音。它使用pulseaudio作为音频后端。 import GHC.Float import Control.Arrow import
java - Vaadin 消耗 REST 和性能
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
JAVAFX tab onCloseRequest 消耗 tabPane
tab.setOnCloseRequest(e -> { if (getEditorForTextArea(getSelectedTextArea()) != null

首页

博学

6Ren·AI

商城

对象和进程的Python内存消耗