gpt4 book ai didi

python - 当不需要某些特定的通配符组合时,如何在蛇形中使用扩展?

转载 作者:行者123 更新时间:2023-12-01 10:32:29 27 4
gpt4 key购买 nike

假设我有以下文件,我想在这些文件上使用 snakemake 自动应用一些处理:

test_input_C_1.txt
test_input_B_2.txt
test_input_A_2.txt
test_input_A_1.txt

以下蛇文件使用 expand确定所有潜在的最终结果文件:
rule all:
input: expand("test_output_{text}_{num}.txt", text=["A", "B", "C"], num=[1, 2])

rule make_output:
input: "test_input_{text}_{num}.txt"
output: "test_output_{text}_{num}.txt"
shell:
"""
md5sum {input} > {output}
"""

执行上面的snakefile导致如下错误:

MissingInputException in line 4 of /tmp/Snakefile:
Missing input files for rule make_output:
test_input_B_1.txt

该错误的原因是 expand用途 itertools.product在引擎盖下生成通配符组合,其中一些恰好对应于丢失的文件。

如何过滤掉不需要的通配符组合?

最佳答案

expand function 接受第二个可选的非关键字参数,以使用与默认函数不同的函数来组合通配符值。

可以创建 itertools.product 的过滤版本通过将其包装在一个高阶生成器中,该生成器检查生成的通配符组合是否不在预先建立的黑名单中:

from itertools import product

def filter_combinator(combinator, blacklist):
def filtered_combinator(*args, **kwargs):
for wc_comb in combinator(*args, **kwargs):
# Use frozenset instead of tuple
# in order to accomodate
# unpredictable wildcard order
if frozenset(wc_comb) not in blacklist:
yield wc_comb
return filtered_combinator

# "B_1" and "C_2" are undesired
forbidden = {
frozenset({("text", "B"), ("num", 1)}),
frozenset({("text", "C"), ("num", 2)})}

filtered_product = filter_combinator(product, forbidden)

rule all:
input:
# Override default combination generator
expand("test_output_{text}_{num}.txt", filtered_product, text=["A", "B", "C"], num=[1, 2])

rule make_output:
input: "test_input_{text}_{num}.txt"
output: "test_output_{text}_{num}.txt"
shell:
"""
md5sum {input} > {output}
"""

可以从配置文件中读取缺少的通配符组合。

这是一个json格式的例子:
{
"missing" :
[
{
"text" : "B",
"num" : 1
},
{
"text" : "C",
"num" : 2
}
]
}
forbidden set 将在蛇文件中读取如下:
forbidden = {frozenset(wc_comb.items()) for wc_comb in config["missing"]}

关于python - 当不需要某些特定的通配符组合时,如何在蛇形中使用扩展?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41185567/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com