gpt4 book ai didi

hadoop - 为什么在使用 hadoop fs -put 命令时 mapreduce 没有启动?

转载 作者:可可西里 更新时间:2023-11-01 16:29:02 24 4
gpt4 key购买 nike

请原谅这个基本问题。但我想知道为什么当我们尝试加载一些大小大于 block 大小时的 mapreduce 作业没有启动。

我在某个地方了解到 MapReduce 将负责将数据集从 LFS 加载到 HDFS。那为什么当我给 hadoop fs -put 命令时我无法在控制台上看到 mapreduce 日志?

提前致谢。

最佳答案

您正在考虑将生成 MapReduce 作业的 hadoop distcp。

https://hadoop.apache.org/docs/stable/hadoop-distcp/DistCp.html

DistCp Version 2 (distributed copy) is a tool used for large inter/intra cluster copying. It uses MapReduce to effect its distribution, error handling and recovery, and reporting. It expands a list of files and directories into input to map tasks, each of which will copy a partition of the files specified in the source list.

hadoop fs -puthdfs dfs -put 完全由 HDFS 实现,不需要 MapReduce。

关于hadoop - 为什么在使用 hadoop fs -put 命令时 mapreduce 没有启动?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44471123/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com