r - 如何用 NA 标记丢失的左手搭配-6ren

r - 如何用 NA 标记丢失的左手搭配

转载作者：行者123 更新时间：2023-12-04 08:19:16

25

4

我想计算引理 GO 的搭配，包括它的所有形式，例如 go , goes , gone ，等等。:

go <- c("go after it", "here we go", "he went bust", "go get it go", "i 'm gon na go", "she 's going berserk")

引理形式存储在此向量中:

lemma_GO <- c("go", "goes", "going", "gone", "went", "gon na")

这个向量把它们变成了一个交替模式:

pattern_GO <- paste0("\\b(", paste0(lemma_GO, collapse = "|"), ")\\b")

但是，当使用带有 str_extract_all 的模式时提取 GO 的紧邻左侧搭配，提取会错过那些 GO 的字符串是字符串中的第一个单词，稍后在字符串中再次出现:

library(stringr)
str_extract_all(go, paste0("'?\\b[a-z']+\\b(?=\\s?", pattern_GO, ")"))
[[1]]
character(0)

[[2]]
[1] "we"

[[3]]
[1] "he"

[[4]]
[1] "it"

[[5]]
[1] "'m" "na"

[[6]]
[1] "'s"

预期的结果是这样的:

[[1]]
[1] NA

[[2]]
[1] "we"

[[3]]
[1] "he"

[[4]]
[1]  NA  "it"

[[5]]
[1] "'m" "na"

[[6]]
[1] "'s"

怎么提取出来还返回 NA在没有左手搭配的情况下？

最佳答案

您可以在字符串的开头或您的消费模式添加一个替代匹配:

str_extract_all(go, paste0("('?\\b[a-z']+\\b|^)(?=\\s?", pattern_GO, ")"))

见 regex demo .
见 R demo :

go <- c("go after it", "here we go", "he went bust", "go get it go", "i 'm gon na go", "she 's going berserk")
lemma_GO <- c("go", "goes", "going", "gone", "went", "gon na")
pattern_GO <- paste0("\\b(", paste0(lemma_GO, collapse = "|"), ")\\b")
library(stringr)
str_extract_all(go, paste0("('?\\b[a-z']+\\b|^)(?=\\s?", pattern_GO, ")"))

输出:

[[1]]
[1] ""

[[2]]
[1] "we"

[[3]]
[1] "he"

[[4]]
[1] ""   "it"

[[5]]
[1] "'m" "na"

[[6]]
[1] "'s"


Sukces #stdin #stdout 0.26s 42528KB
[1] "\\b(go|goes|going|gone|went|gon na)\\b"
[[1]]
[1] ""

[[2]]
[1] "we"

[[3]]
[1] "he"

[[4]]
[1] ""   "it"

[[5]]
[1] "'m" "na"

[[6]]
[1] "'s"

如果需要，您可以使用将所有空项目转换为 NA

res <- str_extract_all(go, paste0("('?\\b[a-z']+\\b|^)(?=\\s?", pattern_GO, ")"))
res <- lapply(res, function(x) ifelse(x=="", NA, x))

关于r - 如何用 NA 标记丢失的左手搭配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65566442/

25

4

0

文章推荐： amazon-web-services - 无法在 Unity3d 中创建 AmazonGameLiftClient

文章推荐： c++ - BOOST_SPIRIT_DEFINE 不明白

CSS 定位——元素在右下角、左手 Angular
我想将“Game on Sep 27”放在左下角，“Lost 100 chips”对面。但我看不到将它定位在左下角。这是我当前的 CSS: 有什么建议吗？非常感谢! 最佳答案最简单的方法是将所有三

首页

博学

6Ren·AI

商城

r - 如何用 NA 标记丢失的左手搭配