" file.fasta > output.txt 但是当输入的 fasta 文件很大时,花费的时间会很长。 输入文件如下所示: >seq1 ATCGGTTA-6ren">
gpt4 book ai didi

unix - Unix Grep 的更快替代方案

转载 作者:行者123 更新时间:2023-12-02 01:47:11 25 4
gpt4 key购买 nike

我正在尝试执行以下操作

$ grep ">" file.fasta > output.txt

但是当输入的 fasta 文件很大时,花费的时间会很长。

输入文件如下所示:

>seq1
ATCGGTTA
>seq2
ATGGGGGG

有更快的替代方案吗?

最佳答案

对所有这些使用时间命令

$> time grep ">" file.fasta > output.txt

$> time egrep ">" file.fasta > output.txt

$> time awk '/^>/{print $0}' file.fasta > output.txt -- If ">' is first letter

如果你看到输出..它们几乎是相同的。

在我看来,如果数据是列格式,那么使用awk来搜索。

关于unix - Unix Grep 的更快替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11095160/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com