python - 为什么命名元组总是被 python 的 GC 跟踪？-6ren

python - 为什么命名元组总是被 python 的 GC 跟踪？

转载作者：太空狗更新时间：2023-10-30 01:59:01

24

4

正如我们(或至少我)在 this answer 中了解到的那样仅包含不可变值的简单元组不会被 python 的垃圾收集器跟踪，一旦它发现它们永远不会涉及引用循环:

>>> import gc
>>> x = (1, 2)
>>> gc.is_tracked(x)
True
>>> gc.collect()
0
>>> gc.is_tracked(x)
False

为什么 namedtuple 不是这种情况？ s，它们是来自具有命名字段的集合模块的元组的子类？

>>> import gc
>>> from collections import namedtuple
>>> foo = namedtuple('foo', ['x', 'y'])
>>> x = foo(1, 2)
>>> gc.is_tracked(x)
True
>>> gc.collect()
0
>>> gc.is_tracked(x)
True

他们的实现中是否有一些固有的东西可以防止这种情况发生，或者只是被忽视了？

最佳答案

我能找到的关于此的唯一注释是在 Python 源代码的 gcmodule.c 文件中:

NOTE: about untracking of mutable objects. Certain types of container cannot participate in a reference cycle, and so do not need to be tracked by the garbage collector. Untracking these objects reduces the cost of garbage collections. However, determining which objects may be untracked is not free, and the costs must be weighed against the benefits for garbage collection.

There are two possible strategies for when to untrack a container:

When the container is created.

When the container is examined by the garbage collector.

Tuples containing only immutable objects (integers, strings etc, and recursively, tuples of immutable objects) do not need to be tracked. The interpreter creates a large number of tuples, many of which will not survive until garbage collection. It is therefore not worthwhile to untrack eligible tuples at creation time.

Instead, all tuples except the empty tuple are tracked when created. During garbage collection it is determined whether any surviving tuples can be untracked. A tuple can be untracked if all of its contents are already not tracked. Tuples are examined for untracking in all garbage collection cycles. It may take more than one cycle to untrack a tuple.

Dictionaries containing only immutable objects also do not need to be tracked. Dictionaries are untracked when created. If a tracked item is inserted into a dictionary (either as a key or value), the dictionary becomes tracked. During a full garbage collection (all generations), the collector will untrack any dictionaries whose contents are not tracked.

The module provides the python function is_tracked(obj), which returns the current tracking status of the object. Subsequent garbage collections may change the tracking status of the object. Untracking of certain containers was introduced in issue #4688, and the algorithm was refined in response to issue #14775.

(查看链接的问题以查看为允许取消跟踪而引入的真实代码)

这条评论有点模棱两可，但它没有说明选择要“取消跟踪”的对象的算法适用于通用容器。这意味着代码只检查 tuple(和 dict)，而不检查它们的子类。

您可以在文件的代码中看到这一点:

/* Try to untrack all currently tracked dictionaries */
static void
untrack_dicts(PyGC_Head *head)
{
    PyGC_Head *next, *gc = head->gc.gc_next;
    while (gc != head) {
        PyObject *op = FROM_GC(gc);
        next = gc->gc.gc_next;
        if (PyDict_CheckExact(op))
            _PyDict_MaybeUntrack(op);
        gc = next;
    }
}

注意对 PyDict_CheckExact 的调用，并且:

static void
move_unreachable(PyGC_Head *young, PyGC_Head *unreachable)
{
    PyGC_Head *gc = young->gc.gc_next;

  /* omissis */
            if (PyTuple_CheckExact(op)) {
                _PyTuple_MaybeUntrack(op);
            }

请注意对 PyTuple_CheckExact 的调用。

另请注意，tuple 的子类不必是不可变的。这意味着如果您想在 tuple 和 dict 之外扩展此机制，您需要一个通用的 is_immutable 函数。由于 Python 的动态性(例如，类的方法可能会在运行时更改，而这对于 tuple 来说是不可能的，因为它是一个内置类型)。因此，开发人员选择坚持少数特殊情况，仅使用一些众所周知的内置插件。

这就是说，我相信它们也可以特例namedtuple，因为它们是非常简单的类。会有一些问题，例如，当您调用 namedtuple 时，您正在创建一个新类，因此 GC 应该检查一个子类。这可能是以下代码的问题:

class MyTuple(namedtuple('A', 'a b')):
    # whatever code you want
    pass

因为 MyTuple 类需要不是不可变的，所以 GC 应该检查该类是 namedtuple 的直接子类 为了安全起见。不过，我很确定这种情况有解决方法。

他们可能没有，因为 namedtuple 是标准库的一部分，而不是 python 核心。也许开发人员不想让核心依赖于标准库的模块。

所以，回答你的问题:

不，在他们的实现中没有任何东西可以内在地阻止对 namedtuple
不，我相信他们没有“只是忽略”了这一点。然而，只有 python 开发人员才能明确回答为什么他们选择不包括它们。我的猜测是，他们认为这不会为更改提供足够大的好处，并且他们不想让核心依赖于标准库。

关于python - 为什么命名元组总是被 python 的 GC 跟踪？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19770515/

24

4

0

文章推荐： python - 类变量和实例变量的区别

文章推荐： database - 如何更好地组织数据库以说明用户状态的变化

文章推荐： database - 无法从 Web 服务器复制 Umbraco.sdf

文章推荐： python - 如何在 Here Document 之后给出参数？

php - xdebug 跟踪/跟踪 php 回显，打印调用
有没有办法在 xdebug 跟踪输出中查看 echo 或 print 函数调用。我正在为我在我的服务器中运行的所有脚本寻找一个全局配置(或一种方法)。例子: 我希望跟踪输出显示 echo 调用。默
grails - 跟踪/BPT陷阱:5个正在运行的grails 2.1.0应用-跟踪/BPT陷阱:5
我将应用程序从2.0.0M2升级到了2.1.0，但是当我尝试运行该应用程序时，出现此错误: Note: /Volumes/Info/proyectos-grails/vincoorbis/Member
共享点日志记录/跟踪
我如何在共享点中执行日志记录。我想使用跟踪。以便它记录 12 个配置单元日志。最佳答案微软提供了一个例子: http://msdn.microsoft.com/en-us/library/aa9
Android - 跟踪
如何跟踪 eclipse 和 android 模拟器的输出。我习惯于在 Flash 和 actionscript 中这样做。在 AS3 中它将是: trace('我的跟踪语句'); 最佳答案您有几
Postgresql 跟踪
是否可以在 Postgresql 上进行查询跟踪？我在带有 OLEDB 界面的 Windows 上使用 9.0。此外，我需要它是实时的，而不是像默认情况下那样缓冲... 最佳答案我假设您的意思是在
trace - HaxeFlixel 跟踪
第一天 HaxeFlixel 编码器。愚蠢的错误，但谷歌没有帮助我。如何使用 Haxe、NME 和 Flixel 追踪到 FlashDevelop 输出。它在使用 C++ 执行时有效，但对 Flas
iPhone:跟踪/识别个人触摸
我有一个关于 iPhone 上跟踪触摸的快速问题，我似乎无法就此得出结论，因此非常感谢任何建议/想法: 我希望能够跟踪和识别 iPhone 上的触摸，即。基本上每次触摸都有一个起始位置和当前/移动位置
php - 跟踪/跟踪Yii错误信息并将其存储在数据库中
我正在做我的大学项目，我只想跟踪错误及其信息。错误信息应该与用户源设备信息一起存储在数据库中(为了检测源设备，我正在使用MobileDetect扩展名)。我只想知道应该在哪里编写代码，以便获得所有错误
azure - 如何利用应用程序洞察进行分布式跟踪/跟踪
我正在 Azure 中使用多个资源，流程如下所示: 从 sftp 获取文件使用 http 调用的数据丰富文件将消息放入队列处理消息调用一些外部电话传递数据我们如何跟踪上述过程中特定“运行”
WCF 跟踪。如何获得关闭连接的确切原因？
在我的 WCF 服务中，当尝试传输大数据时，我不断收到错误:底层连接已关闭:连接意外关闭我想知道引发此错误的具体原因，因此我设置了 WCF 跟踪并可以读取 traces.svclog 文件。问题是
Firebase + GTM 跟踪
我的目标是在 Firebase Analytics 中获取应用数据，在 Google Universal Analytics 中获取其他自定义数据和应用数据。我的问题是我是否在我的应用上安装 Fir
azure - 如何利用应用程序洞察进行分布式跟踪/跟踪
我正在 Azure 中使用多个资源，流程如下所示: 从 sftp 获取文件使用 http 调用的数据丰富文件将消息放入队列处理消息调用一些外部电话传递数据我们如何跟踪上述过程中特定“运行”
Tridion 分析/跟踪
我们正在考虑跟踪用户通过 Tridion 管理的网站的旅程的要求，然后能够根据此行为将此用户识别为“潜在客户”，然后如果他们在之后没有返回，则触发向此用户发送电子邮件X 天。 SmartTarget
debugging - 如何描述本地函数(跟踪)？
在 Common Lisp 中，函数(跟踪名称)可用于查看有关函数调用的输出。如果我的函数是用局部作用域声明的，我如何描述它以进行跟踪？例如，如何跟踪栏，如下: (defun foo (x)
javascript - 跟踪/观察文本框值已更改
有什么方法可以检测文本框的值是否已更改，是用户明确更改还是某些 java 脚本代码修改了文本框？我需要检测这种变化。最佳答案要跟踪用户更改，您可以添加按键处理程序: $(selector).key
c - 跟踪/等待非子进程
int Enable ( int pid) { int status; #if 1 { printf ( "child pid = %d \n", pid ); long ret =
c - 跟踪/监控系统
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
c - 跟踪/包装开放系统调用
我有以下测试代码: #include int main(void) { fprintf(stderr, "This is a test.\n"); int ret = open("s
Java 应用程序分析/跟踪
我有一个闭源 Java 应用程序，供应商已为其提供了用于自定义的 API。由于我没有其他文档，我完全依赖 API 的 javadoc。我想跟踪特定用例在不同类中实际调用的方法。有什么办法可以用 ec
php - 跟踪 For 循环的最后一个
我正在学习 PHP。我在我的一个 php 函数中使用了如下所示的 for 循环。 $numbers = $data["data"]; for ($i = 0;$i send($numbers[

首页

博学

6Ren·AI

商城

python - 为什么命名元组总是被 python 的 GC 跟踪？