gpt4 book ai didi

hadoop - hadoop 中每个映射器的单个或多个文件?

转载 作者:可可西里 更新时间:2023-11-01 14:21:05 24 4
gpt4 key购买 nike

映射器是同时处理多个文件还是映射器一次只能处理一个文件?我想知道默认行为

最佳答案

  • 默认情况下,典型的 Mapreduce 作业遵循每个映射器的一个输入拆分。
  • 如果文件大小大于拆分大小(即,它有更多多于一个输入拆分),则每个文件有多个映射器。
  • 如果文件不像 Gzip 那样可拆分,则每个映射器一个文件文件,或者如果进程是 Distcp,其中文件是最精细的粒度级别。

关于hadoop - hadoop 中每个映射器的单个或多个文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42429410/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com