gpt4 book ai didi

python - Hadoop Docker容器只能复制到0个节点,而不能复制到minReplication(= 1)

转载 作者:行者123 更新时间:2023-12-02 20:18:14 25 4
gpt4 key购买 nike

我为Hadoop容器尝试了不同的docker镜像,但是当我尝试将文件写入HDFS时它们都不起作用。我总是
错误:

Caused by: org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /t/_temporary/0/_temporary/attempt_20200528153700_0001_m_000006_7/part-00006-34c8bc6d-68a3-4177-bfbf-5f225b28c157-c000.snappy.parquet could only be replicated to 0 nodes instead of minReplication (=1). There are 3 datanode(s) running and 3 node(s) are excluded in this operation.



到目前为止我尝试了什么?
  • 在类似问题下提到的格式化Namenode。
  • 所需的暴露端口8088、50070、9000、50010。
  • 在Datanode中已经有足够的空间。
  • 更新了主机文件,将127.0.0.1映射到容器名称。

  • 我在本地计算机上运行应用程序,也在本地运行的Docker容器。

    创建基本的Dataframe之后,我尝试编写。
    df.write.save('hdfs://hadoop-master:9000/t', format='parquet', mode='append'

    花了将近2分钟,然后引发错误。

    WebUI很好。我可以使用容器中的命令将文件放入HDFS。

    对我来说似乎是网络/连接问题,但找不到。

    最佳答案

    我没有解决问题,但是找到了快速解决方案。

    TL; TR

    MacOS可能会导致此问题。

    在GCP上构建了新的Debian服务器,安装了docker,其镜像和我测试过的Python代码。它工作正常,但是当我尝试从本地计算机连接时仍然出现错误。

    但是仍然需要一个答案,我将其分享给需要快速解决方案的人。

    关于python - Hadoop Docker容器只能复制到0个节点,而不能复制到minReplication(= 1),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62066809/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com