r - 如何分离一串字符并将其作为向量在 R 中读取？-6ren

r - 如何分离一串字符并将其作为向量在 R 中读取？

转载作者：行者123 更新时间：2023-12-04 09:24:15

24

4

我有一个数据库，其中有一列包含一串字符中的物种名称:

plant.first.id$sp.lst[42]

返回:

[1] ['Trema lamarckianum', 'Parasponia rigida', 'Trema tomentosum', 'Trema micranthum', 'Cannabis sativa']

我想获取 plant.first.id$sp.lst 的整个列，并将值转换为一个我可以操作的向量。

例如，我想要这个:

> plant.first.id$sp.lst[3:5]
[1] []                                                                                                                                                        
[2] ['Ficus carica', 'Aphananthe philippinensis', 'Ficus insipida', 'Aphananthe monoica', 'Castilla elastica', 'Maclura cochinchinensis', 'Maclura fruticosa']
[3] ['Artocarpus tamaran']                                                                                                                                    

dput(plant.first.id$sp.lst[3:5])
structure(c(14L, 7L, 1L), .Label = c("['Artocarpus tamaran']", 
"['Artocarpus thailandicus']", "['Boronia algida', 'Zanthoxylum coreanum', 'Citrus reticulata']", 
"['Cissus integrifolia', 'Cissus populnea', 'Cissus hastata', 'Cissus trianae', 'Cissus penninervis', 'Cissus assamica']", 
"['Cryptandra amara', 'Broussonetia papyrifera', 'Serichonus gracilipes', 'Colubrina asiatica', 'Artocarpus tamaran', 'Artocarpus chama', 'Artocarpus thailandicus', 'Artocarpus rubrovenius', 'Gouania mauritiana']", 
"['Enterolobium gummiferum']", "['Ficus carica', 'Aphananthe philippinensis', 'Ficus insipida', 'Aphananthe monoica', 'Castilla elastica', 'Maclura cochinchinensis', 'Maclura fruticosa']", 
"['Maclura cochinchinensis']", "['Pouteria multiflora', 'Diospyros toposia', 'Van-royena castanosperma', 'Micropholis guyanensis', 'Pycnandra comptonii', 'Chrysophyllum venezuelanense']", 
"['Pouteria multiflora', 'Van-royena castanosperma', 'Chrysophyllum venezuelanense', 'Pycnandra comptonii', 'Micropholis guyanensis']", 
"['Trema lamarckianum', 'Cannabis sativa', 'Trema tomentosum', 'Parasponia rigida', 'Ficus annulata', 'Trema micranthum', 'Celtis iguanaea', 'Artocarpus thailandicus']", 
"['Trema lamarckianum', 'Ficus annulata', 'Parasponia rigida', 'Trema tomentosum', 'Trema micranthum', 'Cannabis sativa']", 
"['Trema lamarckianum', 'Parasponia rigida', 'Trema tomentosum', 'Trema micranthum', 'Cannabis sativa']", 
"[]"), class = "factor")

变成这样的:

c("")
c('Ficus carica', 'Aphananthe philippinensis', 'Ficus insipida', 'Aphananthe monoica', 'Castilla elastica', 'Maclura cochinchinensis', 'Maclura fruticosa')
c('Artocarpus tamaran')

以列表形式。

我已经试过了:

strsplit(as.vector(plant.first.id$sp.lst[42]),split = ",")

但它不可用:

[[1]]
[1] "['Trema lamarckianum'" " 'Parasponia rigida'"  " 'Trema tomentosum'"   " 'Trema micranthum'"   " 'Cannabis sativa']"

还有这个:

gsub("[[(]", "(", plant.first.id$sp.lst[[42]])
gsub("]", ")", plant.first.id$sp.lst[[42]])

但仍然不是很有帮助...

[1] "('Trema lamarckianum', 'Parasponia rigida', 'Trema tomentosum', 'Trema micranthum', 'Cannabis sativa']"
[1] "['Trema lamarckianum', 'Parasponia rigida', 'Trema tomentosum', 'Trema micranthum', 'Cannabis sativa')"

最佳答案

使用strplit 删除多余的空格和撇号

y <- sapply(x, gsub, pattern = "^\\['?|'?]$", replacement = "")
strsplit(y, "', '")

[[1]]
character(0)

[[2]]
[1] "Ficus carica"              "Aphananthe philippinensis" "Ficus insipida"            "Aphananthe monoica"       
[5] "Castilla elastica"         "Maclura cochinchinensis"   "Maclura fruticosa"        

[[3]]
[1] "Artocarpus tamaran"

关于r - 如何分离一串字符并将其作为向量在 R 中读取？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60269021/

24

4

0

文章推荐： regex - R:如何查找字符串中的第一个数字

文章推荐： c - 如何将单元测试添加到已建立的(自动工具)C 项目中

带文本的 ruby 串
我正在尝试创建一个程序，其中字符串的前三个字符重复给定次数，如下所示: foo('Chocolate', 3) # => 'ChoChoCho' foo('Abc', 3) # => 'AbcAbcA
c++ - 从字符串中分 ionic 串
我有以下字符串: std::string str = "Mode:AAA:val:101:id:A1"; 我想分离一个位于 "val:" 和 ":id" 之间的子字符串，这是我的方法: std::st
c++ - 我们如何有效地压缩 DNA 串
DNA 字符串可以是任意长度，包含 5 个字母(A、T、G、C、N)的任意组合。压缩包含 5 个字母(A、T、G、C、N)的 DNA 字母串的有效方法是什么？不是考虑每个字母表 3 位，我们可以使用
python - 编辑距 ionic 串
是否有一种使用 levenstein 距离将一个特定字符串与第二个较长字符串中的任何区域进行匹配的好方法？例子: str1='aaaaa' str2='bbbbbbaabaabbbb' if str
php - mcrypt 加密将 s 串 '%00' 添加到字符串末尾
使用 OAuth 并使用以下函数使用我们称为“foo”(实际上是 OAuth token )的字符串加密 key public function encrypt( $text ) { // a

首页

博学

6Ren·AI

商城

r - 如何分离一串字符并将其作为向量在 R 中读取？