gpt4 book ai didi

hadoop - Java中HDFS配置有什么用?

转载 作者:可可西里 更新时间:2023-11-01 16:49:03 30 4
gpt4 key购买 nike

我对 HDFS Java API 有点困惑,尤其是 hadoop 的作用 Configuration针对我们在 hadoop 服务器安装上的配置(/etc/hadoop/core-site.xml 等)。

  1. 我应该在每个使用 hdfs 的 java 客户端程序中安装 hadoop 吗?
  2. Java 客户端的任何配置集是否会影响它与 hadoop 服务器(hdfs 服务器)的通信方式?

最佳答案

您可以在 core-site.xml 中或通过驱动程序代码中的配置为您的参数设置值。程序中的一组会覆盖xml文件中的一组。因此,例如,如果您必须设置压缩代码。然后你可以将它们添加到 core-site.xml

<property>
<name>mapred.compress.map.output</name>
<value>true</value>
</property>
<property>
<name>mapred.map.output.compression.codec</name>
<value>org.apache.hadoop.io.compress.GzipCodec</value>
</property>

或将此行添加到您的驱动程序代码中。

 Configuration conf = new Configuration();
conf.set("mapred.compress.map.output", "true");
conf.set("mapred.map.output.compression.codec", "org.apache.hadoop.io.compress.GzipCodec");

而且您不需要在每台机器/节点上安装 hadoop。只需将它安装在您的主节点中,然后通过将 IP 添加到列表中来添加数据节点。 This将帮助您了解必须如何设置多节点集群。

关于hadoop - Java中HDFS配置有什么用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34351146/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com