gpt4 book ai didi

r - 使用 Sparklyr 的 FPGrowth/关联规则

转载 作者:行者123 更新时间:2023-11-30 09:59:38 24 4
gpt4 key购买 nike

我正在尝试使用 Sparklyr 构建关联规则算法,并且一直在关注此 blog这确实解释得很好。

但是,在它们适合 FPGrowth 算法之后,有一个部分,作者从返回的“FPGrowthModel 对象”中提取规则,但我无法重现以提取我的规则。

我遇到困难的部分是这段代码:

rules = FPGmodel %>% invoke("associationRules")

有人可以解释一下 FPGmodel 的来源吗?

我的代码如下所示,我没有看到可以从中提取规则的 FPGmodel 对象,任何帮助将不胜感激。

# CACHE HIVE TABLE INTO SPARK
tbl_cache(sc, 'claims', force = TRUE)
med_tbl <- tbl(sc, 'claims')

# SELECT VARIABLES OF INTEREST
med_tbl <- med_tbl %>% select(proc_desc,alt_claim_id)

# REMOVE DUPLICATED ROWS
med_tbl <- dplyr::distinct(med_tbl)

med_tbl <- med_tbl %>% group_by(alt_claim_id)

# AGGREGATING CLAIMS BY CLAIM ID
med_agg <- med_tbl %>%
group_by(alt_claim_id) %>%
summarise(procedures = collect_list(proc_desc))

# CREATE UNIQUE STRING TO IDENTIFY THE MACHINE LEARNING ESTIMATOR
uid = sparklyr:::random_string("fpgrowth_")

# INVOKE THE FPGrowth JAVA CLASS
jobj = invoke_new(sc, "org.apache.spark.ml.fpm.FPGrowth", uid)


jobj %>%
invoke("setItemsCol", "procedures") %>%
invoke("setMinConfidence", 0.03) %>%
invoke("setMinSupport", 0.01) %>%
invoke("fit", spark_dataframe(med_agg))

最佳答案

您链接的博客文章已过时近两年了。自 2b0994co.a.s.ml.fpm.FPGrowth 提供 native 包装器

df <- copy_to(sc, tibble(items=c("a b c", "a b", "c f g", "b c"))) %>%
mutate(items = split(items, "\\\\s+")

fp_growth_model <- ml_fpgrowth(df)
antecedent consequent confidence  lift
<list> <list> <dbl> <dbl>
1 <list [1]> <list [1]> 1 1.33

关于r - 使用 Sparklyr 的 FPGrowth/关联规则,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59507461/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com