gpt4 book ai didi

r - 提取数字后从两列中选择较高的值,R

转载 作者:行者123 更新时间:2023-12-04 04:58:44 28 4
gpt4 key购买 nike

我有一个数据框(8 个变量的 451 个 obs),它有两列(6&7),如下所示:

  Major      Minor
C:726 T:2
A:687 G:41
T:3 C:725

我想创建一列总结这一点。为此,我不关心每个单元格中的字母,但我希望保留更大的数字,无论它在哪一行。即我希望它看起来像这样:
  Summary_column
726
687
725

没有必要,但对于那些想知道我在做什么的人来说,这是一个名为 VCFtools 的程序的输出;它有一个计数功能,可以对 VCF 中的等位基因进行计数,但有时当它显然更常见时,它会将等位基因命名为“次要”。

感谢您的帮助!

最佳答案

我会做这样的事情:

extract <- function(v) {
gsub("^.*:", "", v)
}
within(d, Summary_column <- pmax(extract(Major), extract(Minor)))

这给出了:
  Major Minor Summary_column
1 C:726 T:2 726
2 A:687 G:41 687
3 T:3 C:725 725

关于r - 提取数字后从两列中选择较高的值,R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16416454/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com