gpt4 book ai didi

r - 如何删除R中没有大写的单词?

转载 作者:行者123 更新时间:2023-12-04 11:46:24 26 4
gpt4 key购买 nike

我正在使用 R 进行文本分析。有没有办法使用 tm 删除所有不在大写中的单词?或 stringi ?

如果我有这样的事情

Albert Einstein went to the store and saw his friend Nikola Tesla ... + 200 pags

要转换成
Albert Einstein Nikola Tesla

此致

最佳答案

您可以使用简单的正则表达式删除这些单词

gsub("\\b[a-z]+\\s+", "", x)
# [1] "Albert Einstein Nikola Tesla"

这只是在寻找一个单词边界 > 小写字母 > 它后面的所有字母 > 它后面的所有空格并将其删除

尽管在某些情况下,您有诸如 don't 之类的词,您需要更复杂的正则表达式。就像是
x <- "if Albert Einstein didn't see his friend Nikola Tesla leavin'"
gsub("\\b[a-z][^ ]*(\\s+)?", "", x)
# [1] "Albert Einstein Nikola Tesla "

关于r - 如何删除R中没有大写的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37013143/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com