java - 如何将Java代码转换为mapreduce？-6ren

java - 如何将Java代码转换为mapreduce？

转载作者：行者123 更新时间：2023-12-02 22:06:16

Closed. This question needs to be more focused。它当前不接受答案。

想改善这个问题吗？更新问题，使其仅关注 editing this post一个问题。

4年前关闭。

Improve this question

我正在尝试将Java代码转换为Hadoop MapReduce。
我是MapReduce编程的新手，所以请您帮我一下。

我正在尝试计算文件中所有不同的值，并将输出显示在另一个文件中。

输入:
亚历克斯
亚历克斯
约翰
斯图尔特
麦可
约翰
麦可
亚历克斯

输出:
亚历克斯3

约翰福音2

斯图尔特1

迈克尔2

这是我的代码:

public class test {

    public static void main(String[] args) throws Exception {
        String[] arr = { "sa", "pa" , "ga", "sa", "pa", "la" };
        String[] result = new String[10];
        int counter = 0, count = 0;
        for (int i = 0; i < arr.length; i++) {
            boolean isDistinct = false;
            for (int j = 0; j < i; j++) {
                if (arr[i] == arr[j]) {
                    isDistinct = true;
                    break;
                }
            }
            if (!isDistinct) {
                result[counter++] = arr[i];
            }
        }
        for (int i = 0; i < counter; i++) {
            count = 0;
            for (int j = 0; j < arr.length; j++) {
                if (result[i] == arr[j]) {
                    count++;
                }

            }
            System.out.println(result[i] + " = " + count);

        }
    }
}

在这段代码中，我将输入作为数组给出，但是在实际情况下，我需要从HDFS中的文件中获取该输入。

加上文件的输出应该是在HDFS中制作一个新文件。

最佳答案

您的问题等同于大多数开发人员都会从中开始的标准WordCount MapReduce示例。

Example: WordCount v1.0

WordCount是具有Map and Reduce阶段的单个MapReduce作业。

映射器一次从一个输入文件读取每一行。它发出一个键，该键是值(在您的情况下为名称)和1的计数。

Reduce将根据Key(名称)分组，并将这些值相加，最后生成一个Key和该Key被查看的总次数。

您会注意到该示例包括一个Combine阶段，该阶段(基本上)在Mapper的输出上运行。在此示例中，由于逻辑相同，并且可以接收和发出相同类型的键/值对象，因此可以重复使用Reduce。组合器将减少发送到Reduce阶段的数据量。

关于java - 如何将Java代码转换为mapreduce？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37289355/