- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 itertools 中的排列来制作句子 block 列表的可能组合列表,但即使在我的 64GB 机器上,它似乎也会很快地消耗内存。在内存管理方面我不是最好的,所以我想了解如何使我的代码更好。如果我可以计算出包含数千个这样的 block 的列表,那就太好了。现在我只能买得起10个。
import itertools
from os import sys
arq_in = sys.argv[1]
f1 = open(arq_in, 'r')
list_items = []
items = []
lines = f1.readlines()
for line in lines:
line =line.strip()
list_items.append(line)
for L in range(0, len(list_items)+1):
for subset in itertools.permutations(list_items, L):
items.append(subset)
output = "\n".join(" ".join(map(str,l)) for l in items)
print output
这是我的输入:
ah k l ih r ih ng hh w ae r
ah s eh k ih n d t w ih ch t
ah s iy k r ih t w ah r l d
ah s l iy p ih ng k ae p s l
ah v ay t ah m ah n ae n d
d aw n ih n b ih k ah r ih ng
d ey t ah p oy n t s ih n
ey jh ih n s iy hh ay ah r d ah
f ih ng g ah r hh ae d ah
ih g z ih s t ih n w ao r m
ih k s p r eh sh ih n ih n dh ah
ih n d ah l jh ih n ae n
ih n m ay ey jh ih n s iy
ih n v eh s t ih n b l ae k
ih z m eh zh ah r d ih n
m ae ch ih ng y aa r n ih n
r iy d ih ng ih n p uh r
s ah ch ah d ih z ae s t ah r
s ih s t ah m ae n d ae d
th r eh d m ae ch ih ng y aa r n
最佳答案
按照以下方式运行它将确保您不会耗尽内存,因为我们使用的是惰性求值(这意味着,我们只会在需要时才计算下一次迭代)。
这种方法的优点是不将整个事情保留在内存中,因此即使它仍然会运行很长时间直到完成(它在我的机器上运行一个多小时并且还没有完成!)但它不会崩溃:
import itertools
from os import sys
def lazy_iter(lines):
list_items = []
for line in lines:
line =line.strip()
list_items.append(line)
for L in range(0, len(list_items)+1):
for subset in itertools.permutations(list_items, L):
yield subset
if __name__ == "__main__":
arq_in = sys.argv[1]
f1 = open(arq_in, 'r')
lines = f1.readlines()
for l in lazy_iter(lines):
print map(str,l)
假设您确实不想将任何此类 l
作为字符串进行打印,则可以将迭代限制为仅针对您想要生成的项目数运行并按照您的需要对它们中的每一个进行操作。
关于python - 使用 itertools 的排列爆炸内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45156630/
itertools.repeat(n) 和 itertools.cycle(n) 有区别吗?看起来,它们产生相同的输出。在我需要某个元素的无限循环的情况下,使用一种更有效吗? 最佳答案 简单地说,it
在编写一个查找列表中所有不同组合的程序时,我发现了很多关于使用 intertools.product() 而不是 intertools.combinations_with_replacement()
这段代码: from itertools import groupby, count L = [38, 98, 110, 111, 112, 120, 121, 898] groups = group
我正在读取一个文件(同时执行一些昂贵的逻辑),我需要在不同的函数中迭代多次,所以我真的只想读取和解析文件一次。 解析函数解析文件并返回一个itertools.groupby对象。 def parse_
下面是一些关于itertools.tee的测试: li = [x for x in range(10)] ite = iter(li) ========================
为什么下面的工作: from itertools import chain 但下面的不是吗? import itertools.chain as chain 最佳答案 import foo.bar 语
我必须在列表中生成所有 2 对项目组合。现在,我知道有两种方法可以实现此目的:嵌套 for 循环和 python 的内置 itertools: from itertools import combin
给定 r 为 4 的 itertools 组合: from itertools import combinations mylist = range(0,35) r = 4 combinationsl
我有一个列表 = [1, 2, 3, 3, 6, 8, 8, 10, 2, 5, 7, 7]我正在尝试使用 groupby 将其转换为 1 2 3 3 6 8,8 10 2, 5 7,7 基本上,任何
我正在使用itertools对字典键进行分组,使用以下内容: host_data = [] for k,v in itertools.groupby(temp_data, key=lambda x:x
我将自定义函数保存在一个单独的模块中,以便在需要时调用。我的一个新函数使用 itertools,但我不断收到名称错误。 NameError: name 'itertools' is not defin
我有一个简单的 python 函数来执行 itertools 乘积函数。如下所示。 def cart(n, seq): import itertools b = 8 while
我正在创建大量带有替换(乘积)的排列,它需要大量的计算时间。让我们使用像这样的简单函数: def permutations(li): return [p for p in itertools.
我编写了以下代码,使所有 20 个字符长的字符串都包含 A、T、G 和 C 的组合。 但是,我想避免连续出现 3 个以上的相同字符,因此我添加了一个 if 函数来检查这一点。问题是,这是在 itert
我想要一个函数来生成任意数量的数组的叉积。 # Code to generate cross product of 3 arrays M = [1, 1] N = [2, 3] K = [4, 5]
这个问题已经有答案了: Cartesian Product of Sets where No Elements are Identical under Permutations in Python (
我使用 for num in Combinations(nums[0], number): 返回列表中数字的所有组合,其中 num = len(nums[0])- 1.. 我想做的是作为单独的变量返回
我想将 itertools.count 元素作为列表索引传递,但会导致以下错误: TypeError: list indices must be integers or slices, not ite
有没有更好的方法来列出所有可能的组合,并用每个元素的最小和最大出现次数进行替换,而不是(1)使用itertools.combinations_with_replacement()列出所有可能的组合,而
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
我是一名优秀的程序员,十分优秀!