- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我是 python 编程的新手,正在尝试解析一个 fasta 文件并计算属于文件中每个 ID 的读取次数(在此处使用玩具示例,但计划用于每个具有 1-100,000 次读取的宏基因组序列文件主题)。我想获得的输出将是一个类似于以下内容的文本文件:
Total reads: 8
Mean read length: 232.5
Median: 234.5
Mode: 250
Max: 250
Min: 209
Sample Count
001-00 1
002-00 4
003-00 3
Etc.
通过 biopython cookbook 和其他帖子中提供的示例,我已经能够拼凑出以下代码,这些代码将生成读取长度的描述性统计信息,并为我提供单次读取的 SampleID 和读取长度,但我似乎无法理解如何最好地计算每个 ID 在文件中出现的次数并按上述格式设置输出格式(用制表符分隔样本和制表符字段)。到目前为止我放在一起的代码是:
from Bio import SeqIO
import statistics
records = list(SeqIO.parse("test_fasta.fasta", "fasta"))
print("Total reads: %i" % len(records))
sizes = [len(rec) for rec in SeqIO.parse("test_fasta.fasta", "fasta")]
print("Mean read length:", statistics.mean(sizes))
print("Median:", statistics.median(sizes))
print("Mode:", statistics.mode(sizes))
print("Max:", max(sizes))
print("Min:", min(sizes))
print()
generator = SeqIO.parse("test_fasta.fasta", "fasta")
print("Sample", "\t", "Read Length")
for seqrecord in generator:
idkeep, rest = seqrecord.id.split(';',1)
print(idkeep, "\t", len(seqrecord))
但这当然给出了读取长度而不是计数。任何关于如何解决这个问题的想法都将不胜感激(对于我迄今为止所写内容中明显低效的任何想法也是如此)。
最佳答案
你可以只拥有一个 dict id -> number of occurrences 并在遍历记录时更新它。另外,我认为你可以删除:
generator = SeqIO.parse("test_fasta.fasta","fasta")
行,因为您已经有了 records
列表。您还可以更改行:
sizes = [len(rec) for rec in SeqIO.parse("test_fasta.fasta", "fasta")]
到:
sizes = [len(rec) for rec in records]
所以你只解析一次 fasta 文件。
我会添加到您的代码中:
occurrences_dict = {}
for seqrecord in records:
idkeep, rest = seqrecord.id.split(';',1)
occurrences_dict[idkeep] = occurrences_dict.get(idkeep, 0) + 1
然后您可以打印每个 ID 出现的次数:
for k in occurrences_dict:
print k, occurrences_dict[k]
关于python - 用 biopython 解析 fasta 文件以计算属于每个 ID 的数字序列读取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31540845/
如果有一张有客户的 table 和一张有地址的 table 。 一位客户必须(仅)有一个地址,但地址不必有客户(取决于字段类型)。所以我只是问如何告诉cake在寻找客户时获取客户地址,但在寻找地址时不
我有一个问题,我需要获取我的画廊表的所有图像(路径),该表拥有博物馆和拥有博物馆的用户。我得到了图像的路径,但这些与拥有博物馆的 user_id 没有关联。 所以简短的描述: 每个用户拥有一个博物馆,
我有一个问题,我需要获取我的画廊表的所有图像(路径),该表拥有博物馆和拥有博物馆的用户。我得到了图像的路径,但这些与拥有博物馆的 user_id 没有关联。 所以简短的描述: 每个用户拥有一个博物馆,
我有用户和个人资料(一对一属于用户) type User struct { ID int Username string Password string
我想以类似于'belongs to' association的方式使用GORM的Django's one-to-one relationships。考虑以下示例,其中每个User与一个Profile相
长期从事 Rails 开发, Backbone 菜鸟。 在我的 Rails 模型中,一个项目有很多任务,一个任务属于一个项目......标准的东西。 尝试在集合中获取项目的任务 json。 Examp
让我们直奔问题(使用 Grails 1.1.1,它应该适用于以前的问题) 我有 2 个域,即:用户和详细信息,如下所示: Class User { String userName ; ..
我正在尝试在 Rails 中设置模型关系,并且需要您的帮助,因为它不起作用:0 class User :creator_id end 就架构而言,request_threads表具有creator_
注意:我在编写问题时解决了问题,因此不需要答案。仍然与答案分享,以便有相同经历的人可以从中受益。 我有一个回收器 View ,其中包含图像和 2 个 TextView 。我想在单击图像时旋转图像,但发
我正在尝试为我的应用程序中的所有按钮添加自定义点击声音。我已经为 UIButton 创建了一个类类别,其中包含以下代码: NSURL *soundURL = [NSURL fileURLWithPat
我有这样一个IP:12.12.12.12 我正在遍历不同的 IP 范围(12.12.12.0/24(示例))格式,并尝试查看 IP 是否在该范围内。 我尝试了各种方法,例如 inet_addr 和比较
看完这个问题 ASP.NET MVC: Nesting ViewModels within each other, antipattern or no? 和 Derick Bailey 的评论 i t
我正在使用 FeedWordPress 从子公司网页将新闻导入母公司的新闻卷。 可在此处查看特定项目的 RSS 摘录:Pastebin 如您所见,我正在将我需要的图像放入 RSS 文件、描述 bloc
假设我有以下数据库架构: dogs 和 owners 与经典的 belongsToMany 相关联。 walks 表怎么样?我希望能够在这种关系中使用 Eloquent 好东西: $dogs = Do
我不知道出了什么问题,但我无法使用 :class_name 选项让belongs_to 工作。有人可以启发我。非常感谢! 这是我的代码片段。 class CreateUsers false
属于 JavaScript 对象原型(prototype)的回调函数如何访问对象成员?回调不能关闭,一切都必须定义如下: function Obji(param){ this.element =
有人可以解释一下 MarkupCompilePass1 和 PartialClassGenerationTask 这两个构建任务是如何归属在一起的吗?目前我不知道他们是否共存或者是否需要对方。有人可以
现在,我尝试了解 Grails 域类和 GORM 中的工作原理。所以,我尝试实验: 我试验了两个域类:Main 和 Sub。 我们走吧! 第 1 步: class Main { String
所以我有一个模型 App.DailyEntry = DS.Model.extend({ user_id: belongsTo('user'), entries: hasMany('En
我正在使用 primeng 组件选项卡菜单。 https://www.primefaces.org/primeng/#/tabmenu我找不到将所选 TAB 的颜色更改为不同颜色的方法。 最佳答案 抱
我是一名优秀的程序员,十分优秀!