gpt4 book ai didi

r - 如何拆分和过滤字符串?

转载 作者:行者123 更新时间:2023-12-04 14:02:29 24 4
gpt4 key购买 nike

考虑这个角色

mystring <- "this, this and this, and this, and this."

我想在 上拆分,但我想摆脱空字符串。我对以下解决方案不起作用感到困惑

拆分工作正常

> str_split(mystring, regex(',|and'))
[[1]]
[1] "this" " this " " this" " " " this" " " " this."

过滤不起作用

> str_split(mystring, regex(',|and')) %>% purrr::keep(., function(x) x!= '')
Error: Predicate functions must return a single `TRUE` or `FALSE`, not a logical vector of length 7
Run `rlang::last_error()` to see where the error occurred.

这里有什么问题?谢谢!

最佳答案

如果我们只返回空白 ("") 而不是空格 (""),那么我们可以使用 nzchar

library(purrr)
library(stringr)
str_split(mystring, regex('\\s*,\\s*|\\s*and\\s*'))[[1]] %>%
keep(nzchar)
[1] "this" "this" "this" "this" "this."

如果我们使用 OP 的代码,请在 keep 步骤之前使用 trimws

str_split(mystring, regex(',|and')) %>%
pluck(1) %>%
trimws %>%
keep(nzchar)
[1] "this" "this" "this" "this" "this."

在 OP 的代码中,keep 不起作用,因为 str_split 中的对象是一个 list 并且该元素未被提取。因此,当我们应用该函数时,它会为单个 list 元素返回多个 TRUE/FALSE,而 keep 期望单个 TRUE/FALSE。在这里,我们正在 pluck 列表元素。在第一个解决方案中,提取是由 [[1]]

完成的

关于r - 如何拆分和过滤字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69559348/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com