作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
最近我一直在运行一个占用大量内存的 Spark 作业,并开始想知道 Spark 的存储级别。我保留了一个 RDD,因为它使用 StorageLevel.MEMORY_AND_DISK
使用了两次。我在工作期间获得 OOM Java 堆空间。然后,当我完全删除持久性时,工作已成功完成并完成。
我一直认为 MEMORY_AND_DISK
基本上是一个完全安全的选项 - 如果内存不足,它会将对象溢出到磁盘,完成。但现在看来,它并没有真正按照我预期的方式发挥作用。
这引出了两个问题:
MEMORY_AND_DISK
将对象溢出到磁盘,那么使用DISK_ONLY
模式是否有意义(除了一些非常具体的配置,例如 Spark.memory.storageFraction=0
)?MEMORY_AND_DISK
将对象溢出到磁盘,我如何通过删除缓存来解决 OOM 问题?我是否错过了什么,而问题实际上出在其他地方?最佳答案
所以,几年后;)这就是我相信发生的事情:
DISK_ONLY
)。MEMORY_AND_DISK
缓存,而 MEMORY
部分从统一区域中取出了一部分,这使得我的工作无法完成(因为 Execution = Unified - 存储
内存不足以执行该作业)DISK_ONLY
缓存,工作似乎也会完成(尽管不一定更快)。https://spark.apache.org/docs/latest/tuning.html#memory-management-overview
关于scala - Spark - StorageLevel(DISK_ONLY 与 MEMORY_AND_DISK)和内存不足 Java 堆空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46458494/
最近我一直在运行一个占用大量内存的 Spark 作业,并开始想知道 Spark 的存储级别。我保留了一个 RDD,因为它使用 StorageLevel.MEMORY_AND_DISK 使用了两次。我在
我问这个问题听起来可能很天真,但这是我最近在项目中遇到的一个问题。需要对此有更好的了解。 df.persist(StorageLevel.MEMORY_AND_DISK) 每当我们在 HBase 读取
我是一名优秀的程序员,十分优秀!