gpt4 book ai didi

regex - 在 R 语料库中搜索以 "esque"结尾的所有单词

转载 作者:行者123 更新时间:2023-12-01 07:22:02 25 4
gpt4 key购买 nike

我正在使用 R 的 tm 包通过字典方法获取词频。我想找到所有以“esque”结尾的单词,无论它们拼写为“abcd-esque”、“abcdesque”还是“abcd esque”(因为我的语料库中存在所有不同的拼写)。如何为此创建正则表达式?这是我到目前为止所拥有的。任何帮助/提示将不胜感激。

text <- Corpus(DirSource("txt/"))
text <- tm_map(text,tolower)
text <- tm_map(text,stripWhitespace)
dtm.text <- DocumentTermMatrix(text)
list<-inspect(
DocumentTermMatrix(text,list(dictionary = c("rose", "green", "esque")))
)

最佳答案

inspect(dtm.text[, grepl("esque$", dtm.text$dimnames$Terms)])

作为旁注,tolower 不适用于当前版本的 tm。您应该改用 contetn_transformer:

tm_map(text, content_transformer(tolower))

关于regex - 在 R 语料库中搜索以 "esque"结尾的所有单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27559290/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com