gpt4 book ai didi

bioinformatics - 在生物信息学中,什么是单例?

转载 作者:行者123 更新时间:2023-12-04 18:05:07 24 4
gpt4 key购买 nike

我很快意识到,生物信息学并不是一门定义明确且易于访问的学科。我与我的一些结果存在明显差异。

我用过 samtools view -b -h -f 8 fileName.bam > mateUnmapped.bam在几个 BAM 文件上。我的印象是此命令仅提取其伙伴与基因组草图不对齐的读取(还包括标题;输出为 BAM 格式)

当我使用 samtools 'flagstat'在生成的文件中,我得到了一个有趣的结果:“单例”的数量与读取的总数不匹配……这对我来说似乎很奇怪。

我能找到的唯一和解是在这里:

http://seqanswers.com/forums/showthread.php?t=46711

一位回答本论坛中提出的问题的人声称,单例有时被定义为完全没有伙伴阅读的序列。然而,这仍然不能解释我的结果。 Flagstat 说我大约 40% 的读取是单例,但我觉得根据我使用的“查看”命令,它们应该都是单例。

经验丰富的生物信息学家可以帮助我吗?

最佳答案

在一般基因组组装中,singlton 是未组装成重叠群或映射到引用的读取。它是只有 1 个读取的重叠群。

在 samtools 中,单例是指已映射但配对未映射的读取。

Flagstat says about 40% of my reads are singletons, but I feel like based on the 'view' command I used, they should ALL be singletons.



我不是 samtools 专家,但我认为 -f 8表示显示其配偶未映射的读取。这并没有说明阅读本身,只是它的伴侣。因此,您可能会在两个配偶根本没有映射 (60%) 的情况下读取读数,并且在只有一个配偶映射 (40%) 的情况下读取读数。 ?

您可能想尝试使用 -f 8 -F 4 运行将读取映射但其伙伴未读取的读取。

关于bioinformatics - 在生物信息学中,什么是单例?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30782192/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com