gpt4 book ai didi

r - 在 R 中提取一个固定长度的字符

转载 作者:行者123 更新时间:2023-12-04 22:20:05 25 4
gpt4 key购买 nike

我有一个由 DNA 序列组成的属性,并想将其翻译成其氨基名称。
所以我需要将序列拆分为 3 的固定长度字符。
这是数据的样本

data=c("AATAGACGT","TGACCC","AAATCACTCTTT")

我怎样才能将它提取到:
[1] "AAT" "AGA" "CGT"
[2] "TGA" "CCC"
[3] "AAA" "TCA" "CTC" "TTT"

到目前为止,我只能找到如何在给定某个正则表达式作为分隔符的情况下拆分字符串

最佳答案

尝试

strsplit(data, '(?<=.{3})', perl=TRUE)

或者
library(stringi)
stri_extract_all_regex(data, '.{1,3}')

关于r - 在 R 中提取一个固定长度的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29868765/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com