gpt4 book ai didi

apache-spark - SparkSession.catalog.clearCache()可以从hdfs中删除数据吗?

转载 作者:行者123 更新时间:2023-12-02 20:16:09 25 4
gpt4 key购买 nike

由于我们已经从CDH迁移到HDP(从2.2到2.3),因此我遇到了一些数据删除问题。正在从hdfs位置读取表,并在运行一段时间的spark作业读取并处理这些表后,将抛出表未找到异常,并且当我们检查位置时所有记录均已消失。在读取该表之前,在我的spark(Java)代码中看到了调用clearCache()的过程。可以删除那些文件吗?如果是,该如何解决?

最佳答案

我认为,您应该看看source code-
Spark具有自己的缓存用户数据的实现,在通过CacheManager管理此缓存时,他们从不会删除它们。看一看

关于apache-spark - SparkSession.catalog.clearCache()可以从hdfs中删除数据吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63476975/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com