gpt4 book ai didi

python - 迭代 BLAST 寻找同源基因

转载 作者:太空宇宙 更新时间:2023-11-04 05:46:55 24 4
gpt4 key购买 nike

我是编程新手,过去几周我一直在研究生物信息学问题,但进展非常有限。

我有一个包含大量基因组的大型 FASTA 文件,我希望运行全对全 BLAST 搜索,该搜索将识别同系物/直系同源物(将通过使用 -outfmt 在其长度上具有 >=95% 的序列相似性来识别) 6) 在我的文件中,将这些基因和非同源/直系同源基因打印到生物体与基因的存在/不存在矩阵中(“1”=存在,“0”=不存在。我被告知交互式全对- all BLAST 将所有同源性/直系同源性更新到一个文件,然后从数据库中删除这些并重复该过程,直到无法执行更多相关的 BLAST 搜索,这可能是解决此问题的一种方法,但尽管我付出了努力,但我什至不知道该怎么做这个。我更愿意在可能的情况下在 Python 和/或 Unix/Linux 中执行此操作。

有人可以帮忙吗?

例如:

如果我有 3 个生物体和 4 个基因,如果 BLAST 结果显示 Gene_1 存在于 Organisms_1 和 2 中; Gene_2 存在于所有 Organism 中,Gene_3 仅存在于 Organism_1 中,Gene_4 仅存在于 Organism_3 中。

    Gene_1  Gene_2  Gene_3  Gene_4
Org_1 1 1 1 0
Org_2 1 1 0 0
Org_3 0 1 0 1

最佳答案

如果我没理解错的话,您需要获取以下信息:

-哪些是同系物/直系同源基因

-它们出现在哪个物种中

有一个程序几乎可以完成所有这一切,让我向您介绍 SiLiX

http://lbbe.univ-lyon1.fr/SiLiX

您可以下载它并将其参数化为您的 95% 身份,您“喂养它”您的所有对抗所有爆炸的结果。你会得到一个包含你想要的信息的文件!

该文件很容易解析(尤其是在 python 中),因此您可以从中提取所需的所有信息。所以你可以从中创建你的矩阵。

关于python - 迭代 BLAST 寻找同源基因,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31819132/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com