gpt4 book ai didi

r - 我有一个单词数据框,我想过滤掉 R 中单词列中有数字的行

转载 作者:行者123 更新时间:2023-12-04 11:37:29 26 4
gpt4 key购买 nike

所以我有一个包含单词及其频率列表的 df。我想用数字过滤掉行;因为它主要是字符,但是 R 将每个条目都识别为一个字符。

我尝试过:

test <- test %>%
filter(word == as.character(word)

但这没有用。

test <- structure(list(word = c("data", "summit", "research", "program", 
"analysis", "study", "evaluation", "minority", "experience", "department",
"statistical", "Experience", "business", "design", "education",
"response", "7", "sampling", "learning", "5"), n = c(213L,
131L, 101L, 98L, 90L, 84L, 82L, 82L, 76L, 72L, 65L, 63L, 60L,
58L, 58L, 58L, 56L, 55L, 50L, 50L)), row.names = c(NA, -20L), class = c("tbl_df",
"tbl", "data.frame"))

此外,有没有办法让所有条目都变成小写?我希望看到一个没有行的 df,其中有一个行号以及所有小写条目(稍后将被分组)。

最佳答案

你可以这样做:

test %>%
mutate(word = tolower(word)) %>%
filter(!grepl("[^A-Za-z]", word))

word n
<chr> <int>
1 data 213
2 summit 131
3 research 101
4 program 98
5 analysis 90
6 study 84
7 evaluation 82
8 minority 82
9 experience 76
10 department 72
11 statistical 65
12 experience 63
13 business 60
14 design 58
15 education 58
16 response 58
17 sampling 55
18 learning 50

关于r - 我有一个单词数据框,我想过滤掉 R 中单词列中有数字的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57364566/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com