gpt4 book ai didi

r - 创建具有多个分隔符的两列

转载 作者:行者123 更新时间:2023-12-03 15:34:49 25 4
gpt4 key购买 nike

我有一个数据框,例如

COl1
scaffold_97606_2-BACs_-__SP1_1
UELV01165908.1_2-BACs_+__SP2_2
UXGC01046554.1_9-702_+__SP3_3
scaffold_12002_1087-1579_-__SP4_4
我想将两者分成两列并得到:
COL1           COL2 
scaffold_97606 2-BACs_-__SP1_1
UELV01165908.1 2-BACs_+__SP2_2
UXGC01046554.1 9-702_+__SP3_3
scaffold_12002 1087-1579_-__SP4_4
所以你可以看到分隔符的变化,它可以是 .Number_Number_Number到目前为止,我写道;
df2 <- df1 %>%
separate(COL1, paste0('col', 1:2), sep = " the separator patterns ", extra = "merge")
但我不知道我应该在 " the separator patterns " 中使用什么分隔符部分

最佳答案

您可以使用

> df1 %>%
separate(COl1, paste0('col', 1:2), sep = "(?<=\\d)_(?=\\d+-)", extra = "merge")
col1 col2
1 scaffold_97606 2-BACs_-__SP1_1
2 UELV01165908.1 2-BACs_+__SP2_2
3 UXGC01046554.1 9-702_+__SP3_3
4 scaffold_12002 1087-1579_-__SP4_4
regex demo
图案详情
  • (?<=\d) - 正向后视,需要在当前位置的左侧紧接一个数字
  • _ - 下划线
  • (?=\d+-) - 正向前瞻,需要一位或多位数字,然后是 -就在当前位置的右侧。
  • 关于r - 创建具有多个分隔符的两列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62930451/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com