gpt4 book ai didi

google-cloud-platform - GCP Dataproc 并行步骤执行

转载 作者:行者123 更新时间:2023-12-01 16:42:47 25 4
gpt4 key购买 nike

我正在使用来自 YAML 文件的工作流模板在 GCP 上创建 dataproc 集群。创建集群后,所有步骤开始并行执行,但我希望在所有其他步骤完成执行后执行一些步骤。有什么办法可以实现吗?

用于集群创建的示例 YAML

jobs:
- pigJob:
continueOnFailure: true
queryList:
queries:
- sh /ui.sh
stepId: run-pig-ui
- pigJob:
continueOnFailure: true
queryList:
queries:
- sh /hotel.sh
stepId: run-pig-hotel

placement:
managedCluster:
clusterName: cluster-abc
labels:
data: cluster
config:
configBucket: bucket-1
initializationActions:
- executableFile: gs://bucket-1/install_git.sh
executionTimeout: 600s
gceClusterConfig:
zoneUri: asia-south1-a
tags:
- test
masterConfig:
machineTypeUri: n1-standard-8
diskConfig:
bootDiskSizeGb: 50
workerConfig:
machineTypeUri: n1-highcpu-32
numInstances: 2
diskConfig:
bootDiskSizeGb: 100
softwareConfig:
imageVersion: 1.4-ubuntu18
properties:
core:io.compression.codec.lzo.class: com.hadoop.compression.lzo.LzoCodec
core:io.compression.codecs: org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec
secondaryWorkerConfig:
numInstances: 2
isPreemptible: true

用于创建集群的命令

gcloud dataproc workflow-templates instantiate-from-file --file file_name.yaml

gcloud 版本:261.0.0

最佳答案

您可以在最后的工作流程步骤中使用 prerequisiteStepIds 列表,以确保它仅在所有先决条件步骤都已运行后运行。您可以在 corresponding JSON API representation for OrderedJob 中看到预期的结构.

jobs:
- pigJob:
continueOnFailure: true
queryList:
queries:
- sh /ui.sh
stepId: run-pig-ui
- pigJob:
continueOnFailure: true
queryList:
queries:
- sh /hotel.sh
stepId: run-pig-hotel
- pigJob:
continueOnFailure: true
queryList:
queries:
- sh /final.sh
stepId: run-final-step
prerequisiteStepIds:
- run-pig-ui
- run-pig-hotel
...

关于google-cloud-platform - GCP Dataproc 并行步骤执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59044096/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com