gpt4 book ai didi

regex - 从 SNP rsid 名称中删除不必要的信息

转载 作者:行者123 更新时间:2023-12-04 09:42:05 30 4
gpt4 key购买 nike

我有一个 SNP 数据集,但没有按照我需要的方式进行编码。而不是仅仅被编码 "rsNUMBER"他们也有芯片分析的信息。例如:GSA-rsNUMBERpsy-rsNUMBER
有些还有最后的芯片分析信息rsNUMBER_CNV_SULT1A3 .

有没有办法删除芯片信息?我的数据是 plink 二进制格式 .bed , .bim , 和 .fam .

最佳答案

你可以使用 Perl 来获得一个简单的 hack 工作:

echo -e "1 rs123-bob 0 123456 N N\n1 bob-rs123 0 123456 N N\n" | perl -p -e "s/(\S+\s+)\S*(rs[0-9]+)\S*(.*)/\1\2\3/g;

以上假设为 .bim 格式。

关于regex - 从 SNP rsid 名称中删除不必要的信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62281695/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com