gpt4 book ai didi

hadoop - Intellij 从 hadoop 集群访问文件

转载 作者:行者123 更新时间:2023-12-02 20:58:40 24 4
gpt4 key购买 nike

作为我的 intellij 环境设置的一部分,我需要连接到远程 hadoop 集群并访问本地 spark 代码中的文件。

有什么方法可以在不创建 hadoop 本地实例的情况下连接到 hadoop 远程环境?

连接代码片段将是理想的答案。

最佳答案

如果您有一个 keytab 文件来对集群进行身份验证,这是我完成它的一种方法:

val conf: Configuration: = new Configuration()
conf.set("hadoop.security.authentication", "Kerberos")
UserGroupInformation.setConfiguration(conf)
UserGroupInformation.loginUserFromKeytab("user-name", "path/to/keytab/on/local/machine")
FileSystem.get(conf)

我相信要做到这一点,您可能还需要一些配置 xml 文档。即 core-site.xml , hdfs-site.xml , 和 mapred-site.xml .这些通常位于 /etc/hadoop/conf/ 之下。 .

您可以将它们放在程序中的一个目录下,并将其标记为 IntelliJ 中的 Resources 目录。

关于hadoop - Intellij 从 hadoop 集群访问文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43791120/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com