gpt4 book ai didi

python - BioPython:如何将氨基酸字母表转换为

转载 作者:太空狗 更新时间:2023-10-30 02:20:55 26 4
gpt4 key购买 nike

在讨论如何使用 Bio.SeqIO.parse() 导入序列数据时,BioPython 说明书指出:

There is an optional argument alphabet to specify the alphabet to be used. This is useful for file formats like FASTA where otherwise Bio.SeqIO will default to a generic alphabet.

如何添加这个可选参数?我有以下代码:

from os.path import abspath
from Bio import SeqIO

handle = open(f_path, "rU")
records = list(SeqIO.parse(handle, "fasta"))
handle.close()

这将从 UniProt 数据库导入大量 FASTA 文件。问题是它在通用的 SingleLetterAlphabet 类中。如何在 SingleLetterAlphabet 和 ExtendedIUPACProtein 之间转换?

最终目标是在这些序列中搜索 GxxxG 等基序。

最佳答案

像这样:

# Import required alphabet
from Bio.Alphabet import IUPAC

# Pass imported alphabet as an argument for `SeqIO.parse`:
records = list(SeqIO.parse(handle, 'fasta', IUPAC.extended_protein))

关于python - BioPython:如何将氨基酸字母表转换为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19552897/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com