gpt4 book ai didi

r - 为什么 dplyr 过滤器不能在简单过滤器中使用空格?

转载 作者:行者123 更新时间:2023-12-04 02:35:16 24 4
gpt4 key购买 nike

我是 R 的新手,我正在尝试探索 R for Data Science 在线电影社区提供的数据集 - https://github.com/rfordatascience/tidytuesday/blob/master/data/2018/2018-10-23/movie_profit.csv .

当我研究并了解更多关于 dplyr 的过滤器功能时,我注意到当我在“distributor”列中搜索一个带有空格的值时,我没有得到任何结果——比如“Walt迪斯尼”在下面的例子中。搜索没有空格的值效果很好,例如“通用”。

此外,我还尝试使用数据集中的其他列,例如“电影”,我在其中过滤了一部包含空白的特定电影;但是,当我这样做时,我没有遇到任何问题,所以我有点困惑。

library(tidyverse)

movies <- read_csv(url("https://github.com/rfordatascience/tidytuesday/raw/master/data/2018/2018-10-23/movie_profit.csv"))

test <- "20th Century Fox"

movies %>%
filter(movie == "Dawn of the Planet of the Apes") %>%
View()

简而言之,我很想知道这背后的原因,以便我知道如果它在我探索的任何 future 数据集中再次出现时如何处理。 给我带来麻烦的代码如下。 我想绘制发行商“Walt Disney”的电影流派分布图。


movies <- read_csv(url("https://github.com/rfordatascience/tidytuesday/raw/master/data/2018/2018-10-23/movie_profit.csv"))

test <- "20th Century Fox"

movies %>%
filter(distributor == "Walt Disney") %>%
ggplot(aes(x = genre)) +
geom_bar()

最佳答案

以下使用 agrepl 进行近似字符串匹配,并在 akrun's answer 中给出图表.

movies %>% 
filter(agrepl("Walt Disney", distributor)) %>%
ggplot(aes(x = genre)) +
geom_bar()

关于r - 为什么 dplyr 过滤器不能在简单过滤器中使用空格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62236601/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com