python - 在 python 中组合 'with' 和 'yield' 是否安全？-6ren

python - 在 python 中组合 'with' 和 'yield' 是否安全？

转载作者：IT老高更新时间：2023-10-28 22:15:53

26

4

使用上下文管理器自动关闭文件是python中的一个常见习语:

with open('filename') as my_file:
    # do something with my_file

# my_file gets automatically closed after exiting 'with' block

现在我想读取几个文件的内容。数据的消费者不知道也不关心数据是来自文件还是非文件。它不想检查它收到的对象是否可以打开。它只是想从中读取一些内容。所以我创建了一个这样的迭代器:

def select_files():
    """Yields carefully selected and ready-to-read-from files"""
    file_names = [.......]
    for fname in file_names:
        with open(fname) as my_open_file:
            yield my_open_file

这个迭代器可以这样使用:

for file_obj in select_files():
    for line in file_obj:
        # do something useful

(请注意，相同的代码可用于使用的不是打开的文件，而是字符串列表 - 这很酷!)

问题是:产生打开的文件是否安全？

看起来像“为什么不呢？”。消费者调用迭代器，迭代器打开文件，将其交给消费者。消费者处理文件并返回到下一个迭代器。迭代器代码恢复，我们退出 'with' block ，my_open_file 对象被关闭，转到下一个文件，等等。

但是如果消费者永远不会返回到下一个文件的迭代器怎么办？ F.e.消费者内部发生异常。或者消费者在其中一个文件中发现了一些非常令人兴奋的东西，并高兴地将结果返回给调用它的人？

在这种情况下迭代器代码永远不会恢复，我们永远不会到达 'with' block 的末尾，并且 my_open_file 对象永远不会关闭!

或者会吗？

最佳答案

您提出了之前提出的批评¹。在这种情况下，清理是不确定的，但是当生成器收集垃圾时，将发生在 CPython 上。 您的里程可能因其他 python 实现而异...

这是一个简单的例子:

from __future__ import print_function
import contextlib

@contextlib.contextmanager
def manager():
    """Easiest way to get a custom context manager..."""
    try:
        print('Entered')
        yield
    finally:
        print('Closed')


def gen():
    """Just a generator with a context manager inside.

    When the context is entered, we'll see "Entered" on the console
    and when exited, we'll see "Closed" on the console.
    """
    man = manager()
    with man:
        for i in range(10):
            yield i


# Test what happens when we consume a generator.
list(gen())

def fn():
    g = gen()
    next(g)
    # g.close()

# Test what happens when the generator gets garbage collected inside
# a function
print('Start of Function')
fn()
print('End of Function')

# Test what happens when a generator gets garbage collected outside
# a function.  IIRC, this isn't _guaranteed_ to happen in all cases.
g = gen()
next(g)
# g.close()
print('EOF')

在 CPython 中运行这个脚本，我得到:

$ python ~/sandbox/cm.py
Entered
Closed
Start of Function
Entered
Closed
End of Function
Entered
EOF
Closed

基本上，我们看到的是，对于耗尽的生成器，上下文管理器会在您期望的时候进行清理。对于没有耗尽的生成器，当生成器被垃圾收集器收集时，清理功能就会运行。当生成器超出范围时会发生这种情况(或者最迟在下一个 gc.collect 循环时发生 IIRC)。

但是，做一些快速实验(例如，在 pypy 中运行上述代码)，我并没有清理所有上下文管理器:

$ pypy --version
Python 2.7.10 (f3ad1e1e1d62, Aug 28 2015, 09:36:42)
[PyPy 2.6.1 with GCC 4.2.1 Compatible Apple LLVM 5.1 (clang-503.0.40)]
$ pypy ~/sandbox/cm.py
Entered
Closed
Start of Function
Entered
End of Function
Entered
EOF

因此，关于所有 python 实现调用上下文管理器的 __exit__ 的断言是不正确的。可能这里的未命中归因于 pypy's garbage collection strategy (这不是引用计数)并且当 pypy 决定获取生成器时，该进程已经关闭，因此它不会打扰它。 .. 在大多数现实世界的应用程序中，生成器可能会足够快地获得并最终确定，这实际上并不重要......

提供严格的保证

如果您想保证您的上下文管理器正确完成，您应该注意 close完成后生成器²。取消注释上面的 g.close() 行给了我确定性清理，因为 GeneratorExit 在 yield 语句(在上下文管理器中)引发) 然后它被生成器捕获/抑制...

$ pypy ~/sandbox/cm.py
Entered
Closed
Start of Function
Entered
Closed
End of Function
Entered
Closed
EOF

$ python3 ~/sandbox/cm.py
Entered
Closed
Start of Function
Entered
Closed
End of Function
Entered
Closed
EOF

$ python ~/sandbox/cm.py
Entered
Closed
Start of Function
Entered
Closed
End of Function
Entered
Closed
EOF

FWIW，这意味着你可以使用 contextlib.closing 清理你的生成器:

from contextlib import closing
with closing(gen_function()) as items:
    for item in items:
        pass # Do something useful!

^{¹最近，一些讨论围绕着 PEP 533旨在使迭代器清理更具确定性。}
^{²关闭一个已经关闭和/或消耗的生成器是完全可以的，这样你就可以调用它而不必担心生成器的状态。}

关于python - 在 python 中组合 'with' 和 'yield' 是否安全？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41881731/

26

4

0

文章推荐： python - BeautifulSoup .prettify() 的自定义缩进宽度

文章推荐： c++ - 是否有任何用于编译语言(如 C++)的 Web 框架？

文章推荐： android - 圆角android图像按钮

文章推荐： c++ - 如何使用宏在 C++ 中生成随机变量名称？

spring 安全、方法安全和 url 安全
我正在学习 Spring 安全性，但我对它的灵活性感到困惑.. 我知道我可以通过在标签中定义规则来保护网址然后我看到有一个@secure 注释可以保护方法。然后还有其他注释来保护域(或 POJO)
java - key 安全 - 如何确保 key 安全？
假设有一个 key 加密 key 位于内存中并且未写入文件或数据库... byte[] kek = new byte[32]; secureRandom.nextBytes(kek); byte[]
Spring 安全 3.2.0 > <安全 :form-login/> deprecated
我有 Spring Security 3.2.0 RC1 的问题我正在使用标签来连接我这表示“方法‘setF
flutter 安全
我正在创建一个使用 Node Js 服务器 API 的 Flutter 应用程序。对于授权，我决定将 JWT 与私钥/公钥一起使用。服务器和移动客户端之间的通信使用 HTTPS。 Flutter 应用
Javascript 安全
在过去的几年里，我一直在使用范围从 Raphael.js 的 javascript 库。至 D3 ，我已经为自己的教育操纵了来自网络各地的动画。我已经从各种 git 存储库下载了 js 脚本，例如 s
python +安全
在 python 中实现身份验证的好方法是什么？已经存在的东西也很好。我需要它通过不受信任的网络连接进行身份验证。它不需要太高级，只要足以安全地获取通用密码即可。我查看了 ssl 模块。但那个模块让我
Hadoop 安全
我正在尝试学习“如何在 Hadoop 中实现 Kerberos？”我已经看过这个文档 https://issues.apache.org/jira/browse/HADOOP-4487我还了解了基本的
phpmyadmin 安全
我有一个带有 apache2、php、mysql 的生产服务器。我现在只有一个站点 (mysite.com) 作为虚拟主机。我想把 phpmyadmin、webalizer 和 webmin 放在那里
记OPNsense防火墙的安装过程-安全
前些天在网上看到防火墙软件OPNsense，对其有了兴趣，以前写过一个其前面的一个软件M0n0wall（关于m0n0wa
Spring 安全+火力地堡
我在 Spring Boot 和 oauth2(由 Google 提供)上编写了 rest 后端，在 "/login" 上自动重定向。除了 web 的 oauth 之外，我还想在移动后端进行 Fire
c++ - 从派生类调用带有抽象基类的类——安全
我想调用类 Foo，它的构造函数中有抽象类 Base。我希望能够从派生自 Base 的 Derived 调用 Foo 并使用 Derived覆盖方法而不是 Base 的方法。我只能按照指示使用原始指
Codeigniter session 安全
如何提高 session 的安全性？ $this->session->userdata('userid') 我一直在为我的 ajax 调用扔掉这个小坏蛋。有些情况我没有。然后我想，使用 DOM 中的
security - assembly 安全
我目前正在为某些人提供程序集编译服务。他们可以在在线编辑器中输入汇编代码并进行编译。然后编译它时，代码通过ajax请求发送到我的服务器，编译并返回程序的输出。但是，我想知道我可以做些什么来防止对服务
security - 安全、黑客等方面的良好资源？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
php - $_session 安全
目前，我通过将 session 中的 key 与 MySQl 数据库中的相同 key 相匹配来验证用户 session 。我使用随机数重新生成 session ，该随机数在每个页面加载时都受 MD5
ASP.Net 安全
Microsoft 模式与实践团队提供了一个很棒的 pdf，称为:“构建安全的 asp.net 应用程序”。 microsoft pdf 由于它是为 .Net 1.0 编写的，所以现在有点旧了。有谁知
lua - (安全)随机字符串？
在 Lua 中，通常会使用 math.random 生成随机值和/或字符串。 & math.randomseed , 其中 os.time用于 math.randomseed . 然而，这种方法有一个
security - ColdFusion 安全
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
javascript - Ajax 安全
我们有一个严重依赖 Ajax 的应用程序。确保对服务器端脚本的请求不是通过独立程序而是通过坐在浏览器上的实际用户的好方法是什么最佳答案真的没有。通过浏览器发送的任何请求都可以由独立程序伪造。归
security - Websocket 安全
我正在寻找使用 WebSockets 与我们的服务器通信来实现 web (angular) 和 iPhone 应用程序。在过去使用 HTTP 请求时，我们使用请求数据、url、时间戳等的哈希值来验证和

首页

博学

6Ren·AI

商城

python - 在 python 中组合 'with' 和 'yield' 是否安全？

提供严格的保证