gpt4 book ai didi

java - 如何将 Hadoop MapReduce 作业实现为非 Map/Reduce,即使没有任何意义?

转载 作者:行者123 更新时间:2023-12-01 19:01:43 25 4
gpt4 key购买 nike

即使以非map/reduce方式实现Hadoop Job对我来说没有任何意义,我也需要在我的大学项目中实现它

Hadoop Job如何作为非map/reduce运行?只需将reducer 设置为0 就足够了吗?

job.setNumreduceTasks(0) 

或者还有其他方法吗?

我的应用程序与映射器和 reducer 类完美配合,计数问题得到解决(类似于世界计数,但以生物学方式)。

最佳答案

事实上,您创建了一个 Job 类,根据定义,它要求您设置映射器和化简器类,这促使您执行映射化简。

如果您必须使用 Hadoop,并且不想执行多个映射或归约操作(例如不并行化操作),则不需要通过 InputFormat 拆分文件(默认情况下逐行读取文件)。

如果您让映射器只读取一个拆分,它将处理整个文件。您可以在映射器任务中解析整个文件,也可以将其直接传递到 reducer 并在那里执行。

基本上,您只是导致数据在此时重新序列化

关于java - 如何将 Hadoop MapReduce 作业实现为非 Map/Reduce,即使没有任何意义?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59627962/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com