gpt4 book ai didi

bioinformatics - 基于变异和人类引用构建DNA序列

转载 作者:行者123 更新时间:2023-12-05 00:28:32 26 4
gpt4 key购买 nike

1000 基因组计划为我们提供了有关数千人 DNA 序列与人类引用 DNA 序列“变异”的信息。变体存储在 VCF 中文件
格式。基本上,对于该项目中的每个人,我们都可以从 VCF 文件中获取他/她的 DNA 变异信息,例如,变异类型(例如插入/删除和 SNP)以及变异相对于引用的位置。引用采用 FASTA 格式。通过将 VCF 文件中的一个人的变异信息和 FASTA 文件中的人类引用相结合,我想为该人构建 DNA 序列。

我的问题是:是否已经存在一些工具可以很好地执行任务,或者我必须自己编写脚本。

最佳答案

perl 脚本 vcf-consensus来自 VCFtools 似乎接近您正在寻找的内容:

vcf-consensus  
Apply VCF variants to a fasta file to create consensus sequence.

Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa
Options:
-h, -?, --help This help message.
-H, --haplotype <int> Apply only variants for the given haplotype (1,2)
-s, --sample <name> If not given, all variants are applied
Examples:
samtools faidx ref.fa 8:11870-11890 | vcf-consensus in.vcf.gz > out.fa

问题答案 New fasta sequence from reference fasta and variant calls file?张贴在映泰也可能有帮助。

关于bioinformatics - 基于变异和人类引用构建DNA序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18852334/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com