python - 生成器表达式与生成器函数以及令人惊讶的急切求值-6ren

python - 生成器表达式与生成器函数以及令人惊讶的急切求值

转载作者：太空宇宙更新时间：2023-11-04 04:00:25

25

4

出于不相关的原因，我以某种方式组合了一些数据结构，同时还用 OrderedDict 替换了 Python 2.7 的默认 dict。数据结构使用元组作为字典中的键。请忽略这些细节(dict 类型的替换在下面没有用，但它在真实代码中)。

import __builtin__
import collections
import contextlib
import itertools


def combine(config_a, config_b):
    return (dict(first, **second) for first, second in itertools.product(config_a, config_b))


@contextlib.contextmanager
def dict_as_ordereddict():
    dict_orig = __builtin__.dict
    try:
        __builtin__.dict = collections.OrderedDict
        yield
    finally:
        __builtin__.dict = dict_orig

这最初按预期工作(dict 可以将非字符串关键字参数作为一种特殊情况):

print 'one level nesting'
with dict_as_ordereddict():
    result = combine(
        [{(0, 1): 'a', (2, 3): 'b'}],
        [{(4, 5): 'c', (6, 7): 'd'}]
    )
print list(result)
print

输出:

one level nesting
[{(0, 1): 'a', (4, 5): 'c', (2, 3): 'b', (6, 7): 'd'}]

但是，当嵌套调用combine 生成器表达式时，可以看到dict 引用被视为OrderedDict，缺少dict 使用元组作为关键字参数的特殊行为:

print 'two level nesting'
with dict_as_ordereddict():
    result = combine(combine(
        [{(0, 1): 'a', (2, 3): 'b'}],
        [{(4, 5): 'c', (6, 7): 'd'}]
    ),
        [{(8, 9): 'e', (10, 11): 'f'}]
    )
print list(result)
print

输出:

two level nesting
Traceback (most recent call last):
  File "test.py", line 36, in <module>
    [{(8, 9): 'e', (10, 11): 'f'}]
  File "test.py", line 8, in combine
    return (dict(first, **second) for first, second in itertools.product(config_a, config_b))
  File "test.py", line 8, in <genexpr>
    return (dict(first, **second) for first, second in itertools.product(config_a, config_b))
TypeError: __init__() keywords must be strings

此外，通过 yield 而不是生成器表达式来实现可以解决问题:

def combine_yield(config_a, config_b):
    for first, second in itertools.product(config_a, config_b):
        yield dict(first, **second)


print 'two level nesting, yield'
with dict_as_ordereddict():
    result = combine_yield(combine_yield(
        [{(0, 1): 'a', (2, 3): 'b'}],
        [{(4, 5): 'c', (6, 7): 'd'}]
    ),
        [{(8, 9): 'e', (10, 11): 'f'}]
    )
print list(result)
print

输出:

two level nesting, yield
[{(0, 1): 'a', (8, 9): 'e', (2, 3): 'b', (4, 5): 'c', (6, 7): 'd', (10, 11): 'f'}]

问题:

为什么生成器表达式中的某些项目(只有第一个？)在第二个示例中被要求之前被评估，或者它需要什么？
为什么没有在第一个例子中评估？我实际上预料到两者都会有这种行为。
为什么基于yield 的版本有效？

最佳答案

在进入细节之前请注意以下几点: itertools.product 评估迭代器参数以计算产品。这可以从文档中等效的 Python 实现中看出(第一行是相关的):

def product(*args, **kwds):
    pools = map(tuple, args) * kwds.get('repeat', 1)
    ...

您也可以使用自定义类和简短的测试脚本来尝试:

import itertools


class Test:
    def __init__(self):
        self.x = 0

    def __iter__(self):
        return self

    def next(self):
        print('next item requested')
        if self.x < 5:
            self.x += 1
            return self.x
        raise StopIteration()


t = Test()
itertools.product(t, t)

创建 itertools.product对象将在输出中显示立即请求所有迭代器项。

这意味着，只要您调用 itertools.product计算迭代器参数。这很重要，因为在第一种情况下，参数只是两个列表，所以没有问题。然后你评估最后的result通过list(result 在上下文管理器之后 dict_as_ordereddict已经返回，所以所有调用 dict将被解析为正常的内置 dict .

现在第二个例子内部调用combine工作仍然正常，现在返回一个生成器表达式，然后将其用作第二个 combine 的参数之一调用 itertools.product .正如我们在上面看到的，这些参数会立即被求值，因此生成器对象被要求生成它的值。为此，它需要解决 dict .但是现在我们仍然在上下文管理器中 dict_as_ordereddict出于这个原因 dict将被解析为 OrderedDict它不接受关键字参数的非字符串键。

重要的是要注意这里使用 return 的第一个版本需要创建生成器对象才能返回它。这涉及创建 itertools.product目的。这意味着这个版本和 itertools.product 一样懒惰.

现在回答为什么 yield 的问题版本有效。通过使用 yield ，调用该函数将返回一个生成器。现在这是一个真正的惰性版本，因为函数体的执行直到请求项目才开始。这意味着内部和外部都不会调用 convert将开始执行函数体并调用 itertools.product直到通过 list(result) 请求元素.您可以通过在该函数内和上下文管理器后面放置一个额外的打印语句来检查:

def combine(config_a, config_b):
    print 'start'
    # return (dict(first, **second) for first, second in itertools.product(config_a, config_b))
    for first, second in itertools.product(config_a, config_b):
        yield dict(first, **second)

with dict_as_ordereddict():
    result = combine(combine(
        [{(0, 1): 'a', (2, 3): 'b'}],
        [{(4, 5): 'c', (6, 7): 'd'}]
    ),
        [{(8, 9): 'e', (10, 11): 'f'}]
    )
print 'end of context manager'
print list(result)
print

随着 yield version 我们会注意到它打印了以下内容:

end of context manager
start
start

即生成器仅在通过 list(result) 请求结果时启动.这不同于 return版本(取消上面代码中的注释)。现在你会看到

start
start

并且在到达上下文管理器的末尾之前，错误已经出现。

附带说明一下，为了让您的代码正常工作，替换 dict需要无效(并且它是第一个版本)，所以我根本不明白你为什么要使用那个上下文管理器。其次，dict文字在 Python 2 中没有排序，关键字参数也没有排序，因此也违背了使用 OrderedDict 的目的。 .另请注意，在 Python 3 中，dict 的非字符串关键字参数行为已被删除，更新任何键的字典的干净方法是使用 dict.update .

关于python - 生成器表达式与生成器函数以及令人惊讶的急切求值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58454141/

25

4

0

文章推荐： c - 在c中加载位图字体

文章推荐： linux - 亚搏体育appGitLab的密码

文章推荐： linux - 非 www 到带有额外重定向的 www

文章推荐： linux - 从 1 个 ec2 实例 rsync 到另一个实例

javascript - 求 for 循环中变量的迭代总和
for (i = 0; i <= 1000; i++) { if ( i % 3 === 0){ console.log(i); } if ( i % 5 ==
arrays - 求 A[i] 与常数之差的最小总和
对于一项作业，我需要解决一个数学问题。我将其缩小为以下内容: 令 A[1, ... ,n] 为 n 整数数组。令y 为整数常量。现在，我必须编写一个算法，在 O(n) 时间内找到 M(y) 的最小
iOS 媒体播放器求
我可以使用 iOS MediaPlayer 并通过这种方式播放电影。但我需要，寻找一秒钟的电影。我该怎么做，我像这样通过 MediaPlayer 播放电影: NSURL *videoURL =
embedded - 求(价格合理)eCos开发板
我听说过 eCos看起来作为一个爱好项目来玩会很有趣。任何人都可以推荐一个价格合理的开发板。如果它不会增加太多成本，我想要几个按钮来按下(并以编程方式检测按下)和一些调试输出的 LCD。以太网会很好
c - 求 k 素数的个数；
给定 a 到 b 的范围和数字 k ，找到 a 到 b [包括两者]之间的所有 k-素数。 k-素数的定义:如果一个数恰好有 k 个不同的素数因子，则该数是 k-素数。即 a=4 , b=10 k=
delphi - 求(免费)网络编程框架
这是对 my previous question 的重新措辞尝试作为它收到的反馈的结果。我想要一个简单的网络通信，我可以将其用作底层框架，而无需再次查看。我只想将一个字符串从一台 PC 推送到另一台
arangodb - 求 ArangoDB 中节点数的交叉节点？
我有许多节点通过其他类型的中间节点连接。如图所示，中间节点可以有多个。我需要找到给定数量的节点的所有中间节点，并按初始节点之间的链接数量对其进行排序。在我的示例中，给定 A、B、C、D，它应该返回节点
java - 求 5x5 数组的和
我的代码遇到问题。我试图找到这个 5x5 数组的总和，但它总是给我总计 0。当我使用 2x2 数组时，它可以工作，但对于 5x5 数组则不起作用。有人可以帮忙吗？ import java.util.*
java - 求 BST 中数组元素的层数
我们有一个给定的数组，我们想要打印 BST 中每个节点的级别。例如，如果给定数组为:{15, 6, 2, 10, 9, 7, 13} 那么答案是: 1 2 3 3 4 5 4 (表示存储15的节点级
r - 求 r 中无限和的值
我对 R 和编程非常陌生，所以请留在我身边:) 我正在尝试使用迭代来查找无限迭代到小数点后第四位的值。 IE。其中小数点后第四位不变。所以 1.4223，其中 3 不再改变，所以小数点后 3 位的结果
c - 求 2 的幂的优雅方法
我的问题与 Fastest way of computing the power that a "power of 2" number used? 非常相似: 将 x=2^y 作为输入，我想输出 y。
matlab - 求 3 个数字之间的最小值
如何找到三个非零数字中最小的一个。我尝试引入一个非常小的数字eps = 1e-6(我的数字为零或明显大于eps)并在min(x,eps)、min(y,eps)之间进行测试)等我什么也没得到。有没有办
java - 求 boolean 矩阵中最大区域的长度
我有一个类(class)，他们计算矩阵中最大的“1”岛，但他的岛概念是“如果两个单元在水平、垂直或对角线上彼此相邻，则称它们是相连的。 “ 我需要帮助来删除对角台阶。 class GFG {
python - 求 Petersen 子图中的哈密顿路径
我开始使用 IDE Jupyter && Python 3.6 并出现了一个问题。我必须通过IDE绘制Petersen子图中的哈密顿路径，但我不知道该怎么做。我显示有关该图的信息: Petersen
java - 求 2000000 以下的素数之和
public static void main(String[] args) { int sum = 2; int isPrime; for(int x = 3; x Mat
java - 求 200 万以下所有素数的和
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: How much time should it take to find the sum of all prime
java - 求 BST 中节点到根的距离
我想找到给定节点到链表二叉搜索树中根的距离。我有下面的代码来计算树的高度(root.getHeightN())，从根到叶子，但我现在需要的是从叶子到根。 public int getHeightN()
python - 求 k 最近邻图的连通分量的数量？
是否有一种优雅的方法使用预先计算的 KDTree 来查找连接组件的数量？现在使用呼吸优先搜索算法以及 k 最近邻的 KDTree 给出的邻接矩阵来查找连接的组件，但是是否有更好的可能性？ import
javascript - 求 angular2 中同名对象数组的值之和
我有一个要求，我需要找到具有相同名称的不同对象中 amt 值的总和。下面是代码片段 traveler = [ { description: 'Senior', Amount: 50}, {
python - 求 pandas 中某些列的总和
我正在尝试使用 pandas 对某些列进行求和，同时保留其他列。例如: member_no, data_1, data_2, data_3, dat_1, dat_2, other_1, other_

首页

博学

6Ren·AI

商城

python - 生成器表达式与生成器函数以及令人惊讶的急切求值