gpt4 book ai didi

python - 如何将目录上传到HDFS

转载 作者:行者123 更新时间:2023-12-02 20:25:40 34 4
gpt4 key购买 nike

我正在一个项目中,我需要通过REST API从Hadoop集群之外的计算机上将目录上载到HDFS。基本上,我需要一个命令,我可以在其中通过终端(或Python脚本)使用REST API将目录发送到HDFS。

WebHDFS文档中指定的唯一方法是上载单个文件。这对我来说还不够,因为我需要通过REST API上传数千个文件。

提前致谢!

这是针对使用单个节点作为NameNode和DataNode的HDFS,这是非常默认的配置。

最佳答案

您可以先尝试创建一个空目录:

curl -i -s --user your_username:your_password --max-time 45 -X PUT https://XXXXX:8443/gateway/default/webhdfs/v1/user/path_to_directory?op=MKDIRS

然后,您可以上传文件:
curl -i -L -s --user your_username:your_password --max-time 45 -X PUT -T file_name.txt \ https://XXXXX:8443/gateway/default/webhdfs/v1/user/path_to_director/path_to_file/file_name?op=CREATE

引用: https://cloud.ibm.com/docs/services/AnalyticsEngine?topic=AnalyticsEngine-upload-files-hdfs

关于python - 如何将目录上传到HDFS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57045995/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com