gpt4 book ai didi

hadoop - 将文件从 Google Cloud Storage 加载到本地 Hadoop 集群

转载 作者:可可西里 更新时间:2023-11-01 15:49:54 25 4
gpt4 key购买 nike

我正在尝试将 Google 云存储文件加载到本地 Hadoop 集群。我开发了一个解决方法(程序)来将本地 EdgeNode 和 distcp 上的文件下载到 Hadoop。但这似乎是双向解决方法,并没有给人留下深刻印象。我浏览了几个网站(links1link2),这些网站总结了使用 Hadoop Google Cloud Storage 连接器进行此类过程,并且需要基础架构级别的配置,这在所有情况下都是不可能的。

有什么方法可以使用 Python 或 Java 以编程方式将文件直接从 Cloud Storage 复制到 Hadoop。

最佳答案

要以编程方式执行此操作,您可以使用 Cloud Storage API client libraries直接从 Cloud Storage 下载文件并将其保存到 HDFS。

但是install Cloud Storage connector会简单很多在您的本地 Hadoop 集群上,并使用 DistCp 将文件从 Cloud Storage 下载到 HDFS。

关于hadoop - 将文件从 Google Cloud Storage 加载到本地 Hadoop 集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50871044/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com