gpt4 book ai didi

hadoop - 如何指定 S3 存储桶作为我对 EMR 的输入

转载 作者:可可西里 更新时间:2023-11-01 14:59:15 24 4
gpt4 key购买 nike

不是复制到 HDFS,是否可以只获取 S3 中存储桶中的对象数组以在 EMR 中处理?

我已经尝试过了,但我不断收到没有凭据的安全警告(即使在我将它们添加到配置中之后)(这是因为只是执行 new Path("s3n://..."))或运行 jar 告诉我,当我尝试使用 AWS sdk 访问我的存储桶时,我缺少 AWS sdk。

最佳答案

你可以在参数部分添加它

将其添加为步骤时选择 CustomJAR

JAR包位置:s3://inbsightshadoop/jar/loganalysis.jar
主类:无
参数: s3://inbsightshadoop/insights-input s3://inbsightshadoop/insights-output
失败时的操作:终止集群

关于hadoop - 如何指定 S3 存储桶作为我对 EMR 的输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18215871/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com