gpt4 book ai didi

r - 如何使用 sparklyr 过滤部分匹配

转载 作者:行者123 更新时间:2023-12-03 14:32:13 28 4
gpt4 key购买 nike

我是 sparklyr 的新手(但熟悉 spark 和 pyspark),我有一个非常基本的问题。我正在尝试根据部分匹配过滤列。在 dplyr 中,我会这样写我的操作:

businesses %>%
filter(grepl('test', biz_name)) %>%
head

然而,在 Spark 数据帧上运行该代码给了我:

Error: org.apache.spark.sql.AnalysisException: Undefined function: 'GREPL'. This function is neither a registered temporary function nor a permanent function registered in the database 'project_eftpos_failure'.; line 5 pos 7

最佳答案

与标准 Spark 相同,您可以使用 rlike (Java 正则表达式):

df <- copy_to(sc, iris) 

df %>% filter(rlike(Species, "osa"))

# or anchored
df %>% filter(rlike(Species, "^.*osa.*$"))
like (简单的 SQL 正则表达式):
df %>% filter(like(Species, "%osa%"))
这两种方法也可以与后缀表示法一起使用,如
df %>% filter(Species %rlike%  "^.*osa.*$")
df %>% filter(Species %like% "%osa%")
分别。
详情见 vignette("sql-translation") .

关于r - 如何使用 sparklyr 过滤部分匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46289490/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com