- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我可以使用 BashOperator
运行 Spark
作业,但我想使用 Spark
使用 SparkSubmitOperator
独立模式。
Here's我的 DAG
用于 SparkSubmitOperator
和 stack-trace
args = {
'owner': 'airflow',
'start_date': datetime(2018, 5, 24)
}
dag = DAG('spark_job', default_args=args, schedule_interval="*/10 * * * *")
operator = SparkSubmitOperator(
task_id='spark_submit_job',
application='/home/ubuntu/test.py',
total_executor_cores='1',
executor_cores='1',
executor_memory='2g',
num_executors='1',
name='airflow-spark',
verbose=False,
driver_memory='1g',
conf={'master':'spark://xx.xx.xx.xx:7077'},
dag=dag,
)
<小时/>
查看 spark_submit_hook
的源代码似乎 _resolve_connection()
总是设置 master=yarn
。如何通过 Spark
独立主 URL 更改 master
属性值?我可以设置哪些属性来在独立模式下运行 Spark
作业?
最佳答案
您可以使用 Airflow Web UI 创建新连接或更改 spark-default
连接。
大师可以是local
, yarn
, spark://HOST:PORT
, mesos://HOST:PORT
和k8s://https://<HOST>:<PORT>
.
您还可以在附加项中提供以下命令:
{"queue": "root.default", "deploy_mode": "cluster", "spark_home": "", "spark_binary": "spark-submit", "namespace": "default"}
“spark-submit”二进制文件应位于 PATH 中,或者在连接的额外部分中设置 Spark-home。
关于airflow - 无法使用 SparkSubmitOperator 执行 Spark 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50532799/
我正在使用 SparkSubmitOperator 但我没有看到任何等效的 Spark 部署模式。如何指定它是客户端还是集群? 这是 SparkSubmitOperator 的 ctor 的签名: @
我可以使用 BashOperator 运行 Spark 作业,但我想使用 Spark 使用 SparkSubmitOperator 独立模式。 Here's我的 DAG 用于 SparkSubmitO
我是 Airflow 和 Spark 的新手,我正在努力使用 SparkSubmitOperator。 我们的 Airflow 调度器和我们的 hadoop 集群没有设置在同一台机器上(第一个问题:这
我是 Airflow 和 SparkSubmitOperator 的新手。我可以看到,当以 YARN 为目标时,Spark 应用程序被提交到“root.default”队列。 简单的问题 - 如何设置
我是一名优秀的程序员,十分优秀!