gpt4 book ai didi

amazon-web-services - EMR5 上的 S3-Dist-Cp 失败

转载 作者:行者123 更新时间:2023-12-02 03:11:18 25 4
gpt4 key购买 nike

我在 emr-5.0.0 版本中遇到了 s3-dist-cp 命令的问题。在我的应用程序中,我需要将一些文件从 hdfs 推送到 S3。我正在使用 s3-dist-cp 命令来实现这一点。它在 emr-4.2.0 中运行良好。但它在 emr-5.0.0 中不起作用。如果我手动运行命令它工作正常。但它在我的应用程序中失败了。我没有对我的应用程序进行任何更改以在 emr-5 上运行它。

如果我需要使用 emr-5,我需要做任何改变吗?我们在 emr-5 中使用 s3-dist-cp 命令的方式有什么变化吗?

我正在使用以下命令:

s3-dist-cp --src /user/hive/warehouse/abc.text --dest s3n://bucket/abc.text

最佳答案

s3-dist-cp 仅在主节点(s3-dist-cp.jar)上可用。

以下是应用程序的位置。

/usr/share/aws/emr/s3-dist-cp/

s3-dist-cp.jar 在从节点中不可用 .
您可以登录从机并进行验证。

因此,您的应用程序失败的原因可能是,在新的 emr 中,您可能正在使用一些工作流管理工具,将应用程序部署在从属设备上并从那里开始。由于 s3 s3-dist-cp 不可用且失败。

解决
第一个选项

捆绑 jar 并使用以下命令
hadoop jar s3-dist-cp.jar --src location --dest location 

第二

在集群上引导 s3-dist-cp.jars

您甚至可以将其作为 java 程序运行

关于amazon-web-services - EMR5 上的 S3-Dist-Cp 失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39813634/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com