gpt4 book ai didi

string - R中的特定字符串拆分

转载 作者:行者123 更新时间:2023-12-04 02:39:50 27 4
gpt4 key购买 nike

我想在 R 中拆分一个文本字符串,但我想考虑一些方面。例如,如果字符串有一个点 . 或一个 !,我希望我的函数将它们作为我的拆分列表的元素。下面是我想要获得的示例。

  mytext="Caracas. Montevideo! Chicago."  
split= "Caracas", "." ,"Montevideo", "!", "Chicago", "."

我目前的方法是用内置的 R 函数 gsub 替换之前的“.”通过“.”,然后我也使用 strsplit 函数。

  mytext=gsub("\\."," .",mytext)
mytext=gsub("\\!"," !",mytext)
unlist(strsplit(mytext,split=' '))

所以,我的问题是:是否有另一种方法可以通过配置 strsplit 函数的参数来实现此目的,或者您认为可以更有效的另一种方法。

如有任何帮助或建议,我们将不胜感激。

最佳答案

Look-ahead 是您在这里寻找的:

strsplit(mytext, split = "(?=(\\.|!))", perl = TRUE)
#[[1]]
#[1] "Caracas" "." " Montevideo" "!" " Chicago" "."

关于string - R中的特定字符串拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20131480/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com