gpt4 book ai didi

bioinformatics - 如何使用 PLink 删除重复的 SNP?

转载 作者:行者123 更新时间:2023-12-04 18:48:34 29 4
gpt4 key购买 nike

我正在与 PLINK 一起工作分析全基因组数据。

有谁知道如何去除重复的 SNP?

最佳答案

在 PLINK 1.9 中,使用 --list-duplicate-vars suppress-first ,这将列出重复项,并删除一个(第一个),保持另一个完整。我知道这会滑倒。

而不是使用 --exclude正如戴维所建议的,您也可以使用 --extract ,保留而不是删除 SNP 列表。在任何基于 Unix 的系统上都有一个简单的方法(假设您的数据是 PED/MAP 格式并被染色体切割):

for i in {1..22}; do
cat yourfile_chr${i}.map | grep "$i" | cut -f -4 | uniq | cut -f -2 | keepers_chr${i}.txt;
done

这将创建一个 keepers_chr.txt带有 SNP ID 的文件,用于位于唯一位置的 SNP。然后运行 ​​PLINK 将原始文件提供给它并使用 --extract keepers_chr , 与 --make-bed --out unique_file

关于bioinformatics - 如何使用 PLink 删除重复的 SNP?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9863208/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com