gpt4 book ai didi

amazon-web-services - AWS Glue 作业运行正确,但返回连接被拒绝错误

转载 作者:行者123 更新时间:2023-12-04 00:14:05 27 4
gpt4 key购买 nike

我正在 AWS 上运行测试作业。我正在从 S3 存储桶读取 CSV 数据,在其上运行 GLUE ETL 作业并将相同的数据存储在 Amazon Redshift 上。 GLUE 作业只是从 S3 读取数据并存储在 Redshift 中,无需任何修改。作业运行良好,我在 Redshift 中获得了所需的结果,但它返回了一个我无法理解的错误。

这是错误日志:

18/11/14 09:17:31 WARN YarnClient: The GET request failed for the URL http://169.254.76.1:8088/ws/v1/cluster/apps/application_1542186720539_0001
com.amazon.ws.emr.hadoop.fs.shaded.org.apache.http.conn.HttpHostConnectException: Connect to 169.254.76.1:8088 [/169.254.76.1] failed: Connection refused (Connection refused)

这是警告而不是错误,但我想了解导致警告的原因。我试图搜索 WARN 中指示的 IP,但我无法找到具有上述 IP 的机器。

最佳答案

我注意到在我的 AWS Glue 作业中出现了这些错误,所以我从 AWS 中找到了一些可能有用的东西:

This WARN message is not so special, and does not mean job failure or any errors directly. I guess there should be other cause.
I would recommend you to enable continuous logging, and check both driver/executor logs to see if there are any suspicious behavior.
If you enable job bookmark, please try disabling it and see how it goes without bookmark.

https://forums.aws.amazon.com/thread.jspa?messageID=927547

我从一开始就禁用了书签。我检查的是我的 Glue 作业将数据写入 S3 并且每个内存都有一个异常(exception),所以我所做的是重新分区数据。
MyDynamicFrame.coalesce(100).write.partitionBy("month").mode("overwrite").parquet("s3://"+bucket+"/"+path+"/out_data")
因此,如果您有一些写入操作,我建议您检查一下您是如何写入 S3 的

关于amazon-web-services - AWS Glue 作业运行正确,但返回连接被拒绝错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53298037/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com