gpt4 book ai didi

r - SparklyR 从 Spark 上下文中删除表

转载 作者:行者123 更新时间:2023-12-02 05:18:12 24 4
gpt4 key购买 nike

想要从 Spark 上下文('sc')中删除单个数据表。我知道单个缓存表可以取消缓存,但这与从 sc 中删除对象不同——据我所知。

library(sparklyr)
library(dplyr)
library(titanic)
library(Lahman)

spark_install(version = "2.0.0")
sc <- spark_connect(master = "local")

batting_tbl <- copy_to(sc, Lahman::Batting, "batting")
titanic_tbl <- copy_to(sc, titanic_train, "titanic", overwrite = TRUE)
src_tbls(sc)
# [1] "batting" "titanic"

tbl_cache(sc, "batting") # Speeds up computations -- loaded into memory
src_tbls(sc)
# [1] "batting" "titanic"

tbl_uncache(sc, "batting")
src_tbls(sc)
# [1] "batting" "titanic"

要断开整个 sc,我将使用 spark_disconnect(sc),但在本例中,它将破坏存储在 sc 内的“titanic”和“batting”表。

相反,我想使用 spark_disconnect(sc, tableToRemove = "batting") 之类的内容删除例如“batting”,但这似乎不可能。

最佳答案

dplyr::db_drop_table(sc, "batting")

我尝试了这个功能,看起来很有效。

关于r - SparklyR 从 Spark 上下文中删除表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41025094/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com