python - 用 biopython 解析 fasta 文件以计算属于每个 ID 的数字序列读取-6ren

python - 用 biopython 解析 fasta 文件以计算属于每个 ID 的数字序列读取

转载作者：太空宇宙更新时间：2023-11-04 05:47:42

25

4

我是 python 编程的新手，正在尝试解析一个 fasta 文件并计算属于文件中每个 ID 的读取次数(在此处使用玩具示例，但计划用于每个具有 1-100,000 次读取的宏基因组序列文件主题)。我想获得的输出将是一个类似于以下内容的文本文件:

Total reads: 8
Mean read length: 232.5
Median: 234.5
Mode: 250
Max: 250
Min: 209

Sample   Count
001-00   1
002-00   4
003-00   3
Etc.

通过 biopython cookbook 和其他帖子中提供的示例，我已经能够拼凑出以下代码，这些代码将生成读取长度的描述性统计信息，并为我提供单次读取的 SampleID 和读取长度，但我似乎无法理解如何最好地计算每个 ID 在文件中出现的次数并按上述格式设置输出格式(用制表符分隔样本和制表符字段)。到目前为止我放在一起的代码是:

from Bio import SeqIO
import statistics

records = list(SeqIO.parse("test_fasta.fasta", "fasta"))
print("Total reads: %i" % len(records))

sizes = [len(rec) for rec in SeqIO.parse("test_fasta.fasta", "fasta")]

print("Mean read length:", statistics.mean(sizes))
print("Median:", statistics.median(sizes))
print("Mode:", statistics.mode(sizes))
print("Max:", max(sizes))
print("Min:", min(sizes))
print()

generator = SeqIO.parse("test_fasta.fasta", "fasta")
print("Sample", "\t", "Read Length")
for seqrecord in generator:
    idkeep, rest = seqrecord.id.split(';',1)
    print(idkeep, "\t", len(seqrecord))

但这当然给出了读取长度而不是计数。任何关于如何解决这个问题的想法都将不胜感激(对于我迄今为止所写内容中明显低效的任何想法也是如此)。

最佳答案

你可以只拥有一个 dict id -> number of occurrences 并在遍历记录时更新它。另外，我认为你可以删除:

generator = SeqIO.parse("test_fasta.fasta","fasta")

行，因为您已经有了 records 列表。您还可以更改行:

sizes = [len(rec) for rec in SeqIO.parse("test_fasta.fasta", "fasta")]

到:

sizes = [len(rec) for rec in records]

所以你只解析一次 fasta 文件。

我会添加到您的代码中:

occurrences_dict = {}
for seqrecord in records:
    idkeep, rest = seqrecord.id.split(';',1)
    occurrences_dict[idkeep] = occurrences_dict.get(idkeep, 0) + 1

然后您可以打印每个 ID 出现的次数:

for k in occurrences_dict:
    print k, occurrences_dict[k]

关于python - 用 biopython 解析 fasta 文件以计算属于每个 ID 的数字序列读取，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31540845/

25

4

0

文章推荐： javascript - 滚动到带有粘性导航和侧边栏的部分

文章推荐： linux - 内核空间内存布局

文章推荐： linux - Cron 作业命令每 8 小时删除一次文件夹的子文件夹

文章推荐： html - 有什么办法可以在垂直菜单中制作一行超文本吗？

mysql - Cakephp 属于
如果有一张有客户的 table 和一张有地址的 table 。一位客户必须(仅)有一个地址，但地址不必有客户(取决于字段类型)。所以我只是问如何告诉cake在寻找客户时获取客户地址，但在寻找地址时不
php - Laravel 属于/有很多
我有一个问题，我需要获取我的画廊表的所有图像(路径)，该表拥有博物馆和拥有博物馆的用户。我得到了图像的路径，但这些与拥有博物馆的 user_id 没有关联。所以简短的描述: 每个用户拥有一个博物馆，
php - Laravel 属于/有很多
我有一个问题，我需要获取我的画廊表的所有图像(路径)，该表拥有博物馆和拥有博物馆的用户。我得到了图像的路径，但这些与拥有博物馆的 user_id 没有关联。所以简短的描述: 每个用户拥有一个博物馆，
go - Golang gorm协会(属于)
我有用户和个人资料(一对一属于用户) type User struct { ID int Username string Password string
go - 双向预加载“属于”关联
我想以类似于'belongs to' association的方式使用GORM的Django's one-to-one relationships。考虑以下示例，其中每个User与一个Profile相
javascript - Backbone 属于 has_many
长期从事 Rails 开发， Backbone 菜鸟。在我的 Rails 模型中，一个项目有很多任务，一个任务属于一个项目......标准的东西。尝试在集合中获取项目的任务 json。 Examp
java - Grails 属于，我应该吗？
让我们直奔问题(使用 Grails 1.1.1，它应该适用于以前的问题) 我有 2 个域，即:用户和详细信息，如下所示: Class User { String userName ; ..
ruby-on-rails - Rails - 属于、拥有很多
我正在尝试在 Rails 中设置模型关系，并且需要您的帮助，因为它不起作用:0 class User :creator_id end 就架构而言，request_threads表具有creator_
java - 单击时旋转 ImageView 属于 RecyclerView
注意:我在编写问题时解决了问题，因此不需要答案。仍然与答案分享，以便有相同经历的人可以从中受益。我有一个回收器 View ，其中包含图像和 2 个 TextView 。我想在单击图像时旋转图像，但发
ios - AVAudioPlayer 属于 ARC 类别
我正在尝试为我的应用程序中的所有按钮添加自定义点击声音。我已经为 UIButton 创建了一个类类别，其中包含以下代码: NSURL *soundURL = [NSURL fileURLWithPat
c++ - IP 属于 CIDR 范围
我有这样一个IP:12.12.12.12 我正在遍历不同的 IP 范围(12.12.12.0/24(示例))格式，并尝试查看 IP 是否在该范围内。我尝试了各种方法，例如 inet_addr 和比较
c# - SelectLists 属于 viewModels 吗？
看完这个问题 ASP.NET MVC: Nesting ViewModels within each other, antipattern or no? 和 Derick Bailey 的评论 i t
php - 属于 FeedWordPress 导入的图像已调整大小 - 但在哪里？
我正在使用 FeedWordPress 从子公司网页将新闻导入母公司的新闻卷。可在此处查看特定项目的 RSS 摘录:Pastebin 如您所见，我正在将我需要的图像放入 RSS 文件、描述 bloc
php - 属于 Laravel 5 中的数据透视表
假设我有以下数据库架构: dogs 和 owners 与经典的 belongsToMany 相关联。 walks 表怎么样？我希望能够在这种关系中使用 Eloquent 好东西: $dogs = Do
ruby-on-rails - 属于 :class_name option fails
我不知道出了什么问题，但我无法使用 :class_name 选项让belongs_to 工作。有人可以启发我。非常感谢! 这是我的代码片段。 class CreateUsers false
javascript - 属于 JavaScript 对象原型(prototype)的回调函数可以访问对象成员吗？
属于 JavaScript 对象原型(prototype)的回调函数如何访问对象成员？回调不能关闭，一切都必须定义如下: function Obji(param){ this.element =
c# - PartialClassGenerationTask 和 MarkupCompilePass1 如何一起工作/属于
有人可以解释一下 MarkupCompilePass1 和 PartialClassGenerationTask 这两个构建任务是如何归属在一起的吗？目前我不知道他们是否共存或者是否需要对方。有人可以
mysql - Grails.Domain 类。属于。为什么？
现在，我尝试了解 Grails 域类和 GORM 中的工作原理。所以，我尝试实验: 我试验了两个域类:Main 和 Sub。我们走吧! 第 1 步: class Main { String
javascript - Ember.js 属于/hasMany 与异步的关系
所以我有一个模型 App.DailyEntry = DS.Model.extend({ user_id: belongsTo('user'), entries: hasMany('En
css - 更改所选选项卡的颜色，属于 TabMenu PRIMENG - 样式
我正在使用 primeng 组件选项卡菜单。 https://www.primefaces.org/primeng/#/tabmenu我找不到将所选 TAB 的颜色更改为不同颜色的方法。最佳答案抱

首页

博学

6Ren·AI

商城

python - 用 biopython 解析 fasta 文件以计算属于每个 ID 的数字序列读取