gpt4 book ai didi

python - 计算文件中某个三联体的数量(DNA 密码子分析)

转载 作者:行者123 更新时间:2023-11-28 19:57:53 24 4
gpt4 key购买 nike

这道题其实是做DNA密码子分析的,简单来说,假设我有这样一个文件:
atgaaaccaaag...
我想计算此文件中存在的“aaa”三元组的数量。重要的是,三胞胎从头开始(这意味着 atg,aaa,cca,aag,...)所以在这个例子中结果应该是 1 而不是 2 'aaa'。
是否有任何 Python 或 Shellscript 方法可以执行此操作?谢谢!

最佳答案

首先读取文件

with open("some.txt") as f:
file_data = f.read()

然后把它分成3份

codons = [file_data[i:i+3] for i in range(0,len(file_data),3)]

然后数数

print codons.count('aaa')

像这样

>>> my_codons = 'atgaaaccaaag'
>>> codons = [my_codons[i:i+3] for i in range(0,len(my_codons),3)]
>>> codons
['atg', 'aaa', 'cca', 'aag']
>>> codons.count('aaa')
1

关于python - 计算文件中某个三联体的数量(DNA 密码子分析),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12610184/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com