gpt4 book ai didi

wildcard - 如何获取snakemake输出规则中通配符值的基本名称?

转载 作者:行者123 更新时间:2023-12-03 06:33:56 29 4
gpt4 key购买 nike

在以下示例中,将在与输入文件相同的位置创建输出文件。有没有办法获取输出部分中通配符值的基本名称,以便我可以使用输入文件的基本名称来命名输出文件,但将其写入不同的位置?

infile=['/home/user/folder1/file1','/home/user/folder2/file2/']

rule one:
input: expand("{myfile}", myfile = infile)

output: "{myfile}" + ".out"

shell: "touch {wildcards.myfile}.out"

最佳答案

在 Snakemake 中有一个简单的方法可以使用 lambda 来做到这一点Python 的函数。

首先,您应该创建一个文件字典,以文件名作为键,以文件路径作为值,如下所示:

files = {'filesA' : 'path/to/fileA.ext', 'filesB' : 'path/to/fileB.ext'}

这个字典可以在snakefile中,也可以在配置文件中。我建议把它放在配置文件中并像这样调用 config['dict_name']

现在让我们使用 lambda 编写规则功能:

rule all : 
input :
#If you want to create in a different directory use this,
#but it has to be like output from rule one.
#expand('{directory}{filename}{extension}',
#directory = 'path/to/newdir',
#filename = config['dictname'].keys(),
#extension = '.out')
#Otherwise
expand('{filename}{extension}',
filename = config['dictname'].keys(),
extension = '.out')
rule one:
input: lambda wildcards: config['dictname'][wildcards.input]

output: "{input}" + ".out"

message: "Executing one using {input}"

shell: "touch {input}.out"

在代码中您有两个规则,第一个名为 all将被执行。因此,当您启动snakemake时它将想要获取与 expand 创建的列表相对应的文件列表。功能。

Snakemake 将查看规则是否生成该文件列表,如果不是,它将在目录中搜索它们。正如您所看到的,您可以使用 expand 指定您想要的一切。目录、文件名、后缀、前缀、扩展名...

在此示例中,Snakemake 想要一些文件名为键字典且扩展名为 .out 的文件。 。规则one是产生它们的完美规则。

规则one工作原理如下:对于字典的每个键,都将执行该规则。输入部分中的 lambda 函数就起到了这个作用。根据记录,通配符可以被称为任何你想要的 input这只是一个例子。

为了更优雅,您可以将 lambda 函数的内容放入变量中,如下所示:

_input_One = lambda wildcards: config['dictname'][wildcards.input]

然后像这样编写规则一输入:

input: _input_One 

有关更多信息,请查看 https://snakemake.readthedocs.io/en/stable/ 上的文档

雨果

关于wildcard - 如何获取snakemake输出规则中通配符值的基本名称?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42675341/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com