gpt4 book ai didi

r - 不存在分隔符时在 R 中分隔字段

转载 作者:行者123 更新时间:2023-12-02 06:01:05 25 4
gpt4 key购买 nike

我有如下数据集:

structure(list(Info = c("Acacia melanoceras 0.0369 0.0427 0.0267 0.0298 0.0501 0.0042 ", 
"Acalypha diversifolia van 0.0670 0.0439 0.0281 0.0427 0.0464 -0.0148 ",
"Acalypha macrostachya vin 0.0657 0.0621 0.0441 0.0522 0.0473 -0.0173 ",
"Adelia triloba 0.0481 0.0350 0.0202 0.0174 0.0286 -0.0349 ",
"Aegiphila panamensis 0.0437 0.0312 0.0166 0.0148 0.0194 -0.0497 ",
"Alchornea costaricensis 0.0568 0.0781 0.0502 0.0221 0.0734 -0.0153 "
)), .Names = "Info", row.names = c(NA, 6L), class = "data.frame")

它目前只有一列,看起来像这样

                                                                   Info
1 Acacia melanoceras 0.0369 0.0427 0.0267 0.0298 0.0501 0.0042
2 Acalypha diversifolia van 0.0670 0.0439 0.0281 0.0427 0.0464 -0.0148
3 Acalypha macrostachya vin 0.0657 0.0621 0.0441 0.0522 0.0473 -0.0173
4 Adelia triloba 0.0481 0.0350 0.0202 0.0174 0.0286 -0.0349
5 Aegiphila panamensis 0.0437 0.0312 0.0166 0.0148 0.0194 -0.0497
6 Alchornea costaricensis 0.0568 0.0781 0.0502 0.0221 0.0734 -0.0153

我希望它有 7 列并且看起来像这样:

           Species             V1     V2      V3     V4    V5     V6
1 Acacia melanoceras 0.0369 0.0427 0.0267 0.0298 0.0501 0.0042
2 Acalypha diversifolia van 0.0670 0.0439 0.0281 0.0427 0.0464 -0.0148
3 Acalypha macrostachya vin 0.0657 0.0621 0.0441 0.0522 0.0473 -0.0173
4 Adelia triloba 0.0481 0.0350 0.0202 0.0174 0.0286 -0.0349
5 Aegiphila panamensis 0.0437 0.0312 0.0166 0.0148 0.0194 -0.0497
6 Alchornea costaricensis 0.0568 0.0781 0.0502 0.0221 0.0734 -0.0153

这个问题一直让我头疼,因为物种名称并不总是两个词。原始文本文件没有分隔,所以我无法以分隔方式阅读它。我只能将它作为一列字符串输入。有人有什么建议吗?

最佳答案

尝试使用 gsub 在我们假定名为“dat”的数据框的“信息”列中的每个数字前放置一个逗号,然后使用 read.csv 重新读取:

> read.csv(text=gsub("( [-[:digit:].])", ",\\1", dat$Info), header=FALSE)
V1 V2 V3 V4 V5 V6 V7
1 Acacia melanoceras 0.0369 0.0427 0.0267 0.0298 0.0501 0.0042
2 Acalypha diversifolia van 0.0670 0.0439 0.0281 0.0427 0.0464 -0.0148
3 Acalypha macrostachya vin 0.0657 0.0621 0.0441 0.0522 0.0473 -0.0173
4 Adelia triloba 0.0481 0.0350 0.0202 0.0174 0.0286 -0.0349
5 Aegiphila panamensis 0.0437 0.0312 0.0166 0.0148 0.0194 -0.0497
6 Alchornea costaricensis 0.0568 0.0781 0.0502 0.0221 0.0734 -0.0153

感谢您描述您的用例。我将来可能会自己使用它。

关于r - 不存在分隔符时在 R 中分隔字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23944362/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com