gpt4 book ai didi

hadoop - 如何从 map-reduce 程序中获取唯一的键和值?

转载 作者:可可西里 更新时间:2023-11-01 16:46:49 26 4
gpt4 key购买 nike

从 reducer ,我得到以下输出。

key     value
1 apple
2 apple
3 apple
4 orange
5 orange

但是,我需要以下输出:

key     value
1 apple
4 orange

什么是正确的实现方式?

最佳答案

enter image description here

此图显示了字数统计流程。

您可以通过以下方式实现:

1.Pig脚本(内部生成一个map reduce job)对于非java开发者你需要安装 pig 。

您需要在 HDFS 中有您的输入文件。

然后在 grunt shell 或 Hue(无论你有什么选择)中使用以下代码

lines = LOAD 'path of input file' AS (line:chararray);

words = FOREACH lines GENERATE FLATTEN(TOKENIZE(line)) as word;

grouped = GROUP words BY word;

wordcount = FOREACH grouped GENERATE group, COUNT(words);

DUMP wordcount;
  1. Map Reduce 编码 面向 Java 开发人员您必须将 Map Reduce Api 与 java 一起使用

引用本教程。

https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html

关于hadoop - 如何从 map-reduce 程序中获取唯一的键和值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36439299/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com