gpt4 book ai didi

r - 合并(粘贴)列

转载 作者:行者123 更新时间:2023-12-02 11:00:59 25 4
gpt4 key购买 nike

我有以下数据框

Tipo Start  End Strand Accesion1 Accesion2
1 gene 197 1558 + <NA> SP_0001
2 CDS 197 1558 + NP_344554 <NA>
3 gene 1717 2853 + <NA> SP_0002
4 CDS 1717 2853 + NP_344555 <NA>
5 gene 2864 3112 + <NA> SP_0003
6 CDS 2864 3112 + NP_344556 <NA>

还有更多“Tipo”值,例如 tRNA、region、exon 或 rRNA,但我只对组合这两个值(gene 和 CDS)感兴趣

我想得到以下内容

Start End Accesion1 Accesion2
1 197 1558 NP_344554 SP_0001

但仅当基因和 CDS 的起始值和结束值一致时。我尝试过使用 dplyr 进行选择、排列和变异,但摆脱 NA 对我来说有点复杂

最佳答案

带有 summarize_eachdplyr 版本:

DF %>% 
group_by(Start, End) %>%
summarise_each(funs(max), Accesion1, Accesion2)

产品:

Source: local data frame [3 x 4]
Groups: Start

Start End Accesion1 Accesion2
1 197 1558 NP_344554 SP_0001
2 1717 2853 NP_344555 SP_0002
3 2864 3112 NP_344556 SP_0003

假设 AccessionX 变量是字符(不适用于因子),并且条件是 Start End 对仅包含两个值,Tipo 和 Gene 各一个,如您的数据集中所示。

关于r - 合并(粘贴)列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29751995/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com