gpt4 book ai didi

python - 解析fasta序列到字典

转载 作者:太空宇宙 更新时间:2023-11-04 09:03:54 25 4
gpt4 key购买 nike

我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta.txt,例如

>seq1
TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG
CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG
>seq2
TCCCTCTAGAGGCTCTTTACCGTGATGCTACATCTTACAGGTATTTCTGAGGCTCTTTCA
AACAGGTGCGCGTGAACAACAACCCACGGCAAACGAGTACAGTGTGTACGCCTGAGAGTA
>seq3
GGTTCCGCTCTAAGCCTCTAACTCCCGCACAGGGAAGAGATGTCGATTAACTTGCGCCCA
TAGAGCTCTGCGCGTGCGTCGAAGGCTCTTTTCGCGATATCTGTGTGGTCTCACTTTGGT

到字典(名称,值)对象,其中名称将是>标题,值将分配给相应的序列。

你可以在下面找到我失败的尝试,通过 2 个列表(不适用于包含 >1 行的长序列)

f = open('input2.txt', 'r')
list={}
names=[]
seq=[]
for line in f:
if line.startswith('>'):
names.append(line[1:-1])
elif line.startswith('A') or line.startswith('C') or line.startswith('G') or line.startswith('T'):
seq.append(line)

list = dict(zip(names, seq))

如果您向我提供如何修复它的解决方案并举例说明如何通过单独的函数进行修复,我将不胜感激。

谢谢你的帮助,

格言

最佳答案

最好用biopython库

from Bio import SeqIO
input_file = open("input.fasta")
my_dict = SeqIO.to_dict(SeqIO.parse(input_file, "fasta"))

关于python - 解析fasta序列到字典,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22698807/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com