gpt4 book ai didi

python - 如何检查序列是否为蛋白质序列?

转载 作者:行者123 更新时间:2023-12-02 04:37:39 24 4
gpt4 key购买 nike

给定一个随机序列,我如何检查该序列是否是蛋白质?

from Bio.Seq import Seq
from Bio.Alphabet import IUPAC
my_prot = Seq("'TGEKPYVCQECGKAFNCSSYLSKHQR")
my_prot


my_prot.alphabet #How to make a check here ??

最佳答案

如果您的 Seq 对象有一个指定的字母表,您可以检查该字母表是否是蛋白质字母表:

from Bio.Seq import Seq
from Bio.Alphabet import IUPAC, ProteinAlphabet
my_prot = Seq("TGEKPYVCQECGKAFNCSSYLSKHQR", alphabet=IUPAC.IUPACProtein())

print isinstance(my_prot.alphabet, ProteinAlphabet)

但是,如果您不知道字母表,则必须使用一些试探法来猜测它是否是蛋白质序列。这可能就像检查序列是否完全是“ATC[GU]”或者它是否使用其他字母代码一样简单。

但这并不完美。例如,序列“ATCG”可以是丙氨酸、苏氨酸、半胱氨酸、甘氨酸(即蛋白质),或者它可以是腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤(DNA)。同样,“ACG”可以是蛋白质、RNA 或 DNA。技术上不可能确定一个序列是 DNA,而不是蛋白质序列。但是,如果您有 SeqRecordSeq 的其他上下文,您可能能够检查它是否是蛋白质序列。

关于python - 如何检查序列是否为蛋白质序列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21609380/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com