gpt4 book ai didi

python - 用于迭代两个可迭代对象的 zip() 替代方法

转载 作者:太空狗 更新时间:2023-10-29 17:22:39 25 4
gpt4 key购买 nike

我有两个必须同时迭代的大(~100 GB)文本文件。

Zip 适用于较小的文件,但我发现它实际上是从我的两个文件中生成行列表。这意味着每一行都存储在内存中。我不需要多次对这些行执行任何操作。

handle1 = open('filea', 'r'); handle2 = open('fileb', 'r')

for i, j in zip(handle1, handle2):
do something with i and j.
write to an output file.
no need to do anything with i and j after this.

是否有替代 zip() 的替代方案,它充当生成器,允许我在不使用 >200GB 内存的情况下遍历这两个文件?

最佳答案

itertools有一个函数 izip那样做

from itertools import izip
for i, j in izip(handle1, handle2):
...

如果文件大小不同,您可以使用 izip_longest ,因为 izip 将在较小的文件处停止。

关于python - 用于迭代两个可迭代对象的 zip() 替代方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2323394/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com