gpt4 book ai didi

R:删除字符串中的部分单词

转载 作者:行者123 更新时间:2023-12-05 03:07:19 26 4
gpt4 key购买 nike

我有一个字符向量

words <- c("somethingspan.", "..span?", "spanthank", "great to hear", "yourspan")

我正在尝试从向量中的每个单词中删除 span 和标点符号

> something thank great to hear your

问题是,如果 span 出现在我感兴趣的单词之前或之后,则没有任何规定。此外,span 可以粘贴到:i) 字符仅(例如 yourspan)、仅标点符号(例如 ..span?)或字符和标点符号(例如 somethingspan.)。

我在 SO 中搜索了答案,但通常我看到要求删除整个单词(如 here )或字母/标点符号之后/之前的字符串元素(如 here )

任何帮助将不胜感激

最佳答案

你可以使用

[[:punct:]]*span[[:punct:]]*

参见 regex demo .

详情

  • [[:punct:]]* - 0+ 个标点字符
  • span - 文字子串
  • [[:punct:]]* - 0+ 个标点字符

R Demo :

words <- c("somethingspan.", "..span?", "spanthank", "great to hear", "yourspan")
words <- gsub("[[:punct:]]*span[[:punct:]]*", "", words) # Remove spans
words <- words[words != ""] # Discard empty elements
paste(words, collapse=" ") # Concat the elements
## => [1] "something thank great to hear your"

如果在删除不需要的字符串后结果只有空白元素,您可以将第二步替换为 words <- words[trimws(words) != ""] (而不是 words[words != ""] )。

关于R:删除字符串中的部分单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47810739/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com