gpt4 book ai didi

Python 客户端支持在 Amazon EMR 上运行 Hive

转载 作者:太空狗 更新时间:2023-10-29 20:57:00 24 4
gpt4 key购买 nike

我注意到 mrjob 和 boto 都不支持在 Amazon Elastic MapReduce (EMR) 上提交和运行 Hive 作业的 Python 接口(interface)。是否有任何其他支持在 EMR 上运行 Hive 的 Python 客户端库?

最佳答案

使用 boto 你可以做这样的事情:

args1 = [u's3://us-east-1.elasticmapreduce/libs/hive/hive-script',
u'--base-path',
u's3://us-east-1.elasticmapreduce/libs/hive/',
u'--install-hive',
u'--hive-versions',
u'0.7']
args2 = [u's3://us-east-1.elasticmapreduce/libs/hive/hive-script',
u'--base-path',
u's3://us-east-1.elasticmapreduce/libs/hive/',
u'--hive-versions',
u'0.7',
u'--run-hive-script',
u'--args',
u'-f',
s3_query_file_uri]
steps = []
for name, args in zip(('Setup Hive','Run Hive Script'),(args1,args2)):
step = JarStep(name,
's3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar',
step_args=args,
#action_on_failure="CANCEL_AND_WAIT"
)
#should be inside loop
steps.append(step)
# Kick off the job
jobid = EmrConnection().run_jobflow(name, s3_log_uri,
steps=steps,
master_instance_type=master_instance_type,
slave_instance_type=slave_instance_type,
num_instances=num_instances,
hadoop_version="0.20")

关于Python 客户端支持在 Amazon EMR 上运行 Hive,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6103816/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com