- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我完成了工作,阅读了 https://spark.apache.org/docs/latest/configuration.html 上的文档
in spark-folder/conf/spark-env.sh:
以上3个参数是什么关系?
据我了解,DRIVER_MEMORY 是主节点/进程可以请求的最大内存。但是对于驱动程序,多机情况如何,例如。 1 master 机器和 2 worker 机器,worker 机器也应该有一些内存可供 spark driver 使用?
EXECUTOR_MEMORY 和 WORKER_MEMORY 对我来说是一样的,只是名称不同,请问这也能解释一下吗?
非常感谢。
最佳答案
首先,您应该知道 1 个Worker(可以说是 1 台机器或 1 个 Worker 节点)可以启动多个 Executors(或多个 Worker Instances - 他们在文档中使用的术语。
SPARK_WORKER_MEMORY
仅用于独立部署模式SPARK_EXECUTOR_MEMORY
用于YARN部署模式在独立模式下,您将 SPARK_WORKER_MEMORY
设置为可以在一台机器(这台机器上的所有执行程序)上使用的内存总量来运行您的 spark 应用程序。
相比之下,在 YARN 模式下,您将 SPARK_DRIVER_MEMORY
设置为 one Executor
SPARK_DRIVER_MEMORY
在 YARN 部署模式下使用,为运行您的应用程序并与集群管理器通信的驱动程序指定内存。关于linux - Spark配置,SPARK_DRIVER_MEMORY、SPARK_EXECUTOR_MEMORY、SPARK_WORKER_MEMORY有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29955075/
我完成了工作,阅读了 https://spark.apache.org/docs/latest/configuration.html 上的文档 in spark-folder/conf/spark-e
我是一名优秀的程序员,十分优秀!