gpt4 book ai didi

hadoop - Datanode中的操作系统

转载 作者:可可西里 更新时间:2023-11-01 16:57:51 26 4
gpt4 key购买 nike

因为我在伪分布式模式下使用 Cloudera CDH4 VM。我的问题是,在实际的 hdfs 集群中,我们要在数据节点上安装 hadoop 吗?我们可以通过登录datanode看到datanode驱动中的数据拆分吗?

最佳答案

是的,在实际安装中(1 个事件名称节点,许多数据节点)必须在每个节点上安装 hadoop。 CDH(和大多数其他供应商)提供软件来帮助进行分布式安装。

您可以通过 webhdfs 查看文件元数据(通常浏览 hdfs),方法是启用 webhdfs(在 hdfs-site.xml 中将属性 dfs.webhdfs.enabled 设置为 true,并重新启动 hdfs),将浏览器定向到 localhost:50070,并浏览到感兴趣的文件。

文件元数据也可以通过 hadoop FileInputFormat API 在 Java 中以编程方式检索。例如,对于文件拆分,您可以使用 getSplits()。它将返回感兴趣文件的每个拆分的位置。一个更直接的解决方案是使用 FileSystem API,特别是 FileSystem.listFiles() ,它返回 block 位置信息。后者可能只包含在后来的 hadoop 2.x 版本中,我不确定。

关于hadoop - Datanode中的操作系统,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27740269/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com