- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
因此,我将来自另一个 MapReduce 作业的输入提供给我的 Mapper。在这里,我对我的输入进行了一些分区,以便 reducer 可迭代对象不会超出内存(这只是一个测试程序)。所以在映射器中,我只是试图删除输入中的“/”,然后在缩减器中添加总和,但是映射器开始给出一个不寻常的输出,它在输出前添加了一个整数,而其余输出是也不尽如人意。 同样在此之前,我收到了类似预期的错误 'org.apache.hadoop.io.Text, received org.apache.hadoop.io.LongWritable'
并添加了这个 ' job1.setMapOutputKeyClass( LongWritable.class);
避免了错误。
job1.setMapOutputValueClass(Text.class);'
如果我在某处严重错误,请原谅。
package test;
import java.io.IOException;
import java.util.*;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
public class MapCom2
{
public static class Map1 extends Mapper<LongWritable, Text, Text, IntWritable> {
private final static IntWritable one = new IntWritable();
private Text word = new Text();
public static int cnt=1;
public void map1(LongWritable key, Text value, Context context) throws IOException, InterruptedException
{
String line = value.toString();
Configuration conf=context.getConfiguration();
String []tokens=line.split("\t");
int l=0;
while(l<tokens.length)
{
if(tokens[l].contains("/"))
break;
l=l+1;
}
int indno=tokens[l].lastIndexOf("/");
String w=tokens[l].substring(0,indno);
int tcnt=Integer.parseInt(tokens[l+1]);
word.set(w);
one.set(tcnt);
context.write(word,one);
}
}
public static int main(String[] args) throws Exception {
Configuration conf1= new Configuration();
Job job1 = new Job(conf1,"mapcom2");
job1.setJarByClass(test.MapCom2.class);
job1.setJobName("mapcom2");
job1.setMapOutputKeyClass(LongWritable.class);
job1.setMapOutputValueClass(Text.class);
job1.setOutputKeyClass(Text.class);
job1.setOutputValueClass(IntWritable.class);
job1.setMapperClass(Map1.class);
//job1.setReducerClass(Reduce1.class);
String op=args[0];
if(!(op.charAt(op.length()-1)+"").equals("/"))
op=op+"/"+"part-r-00000";
else
op=op+"part-r-00000";
job1.setInputFormatClass(TextInputFormat.class);
job1.setOutputFormatClass(TextOutputFormat.class);
FileInputFormat.addInputPath(job1, new Path(op));
FileOutputFormat.setOutputPath(job1, new Path(args[1]));
int ret=job1.waitForCompletion(true)?0:1;
return ret;
}
}
输入是这样的。
)hadoop/0 1
-C/0 1
-classpath/0 1
-cvf/0 1
-d/0 1
-mkdir/0 2
-put/0 2
./0 1
/home/hadoop/hadoop/0 1
/home/hadoop/hadoopAssign/wordcount_classes/0 1
/wordcount/input/0 3
/wordcount/output/0 1
1)/0 1
2)/0 1
3)/0 1
4)/0 1
5/0 1
Assign/hadoop-core-1.1.2.jar/0 1
WordCount.java/0 1
and/0 1
copy/0 1
file01/0 2
file02/0 2
files/0 1
fs/0 3
fs/1 2
hadoop/0 3
hadoop/1 2
jar/0 2
javac/0 1
make/0 1
mkdir/0 1
org.myorg.WordCount/0 1
them/0 1
to/0 2
two/0 1
wordcount.jar/0 2
wordcount/0 1
wordcount/input/0 1
wordcount_classes//0 1
wordcount_classes/0 1
而输出是这样的
0 )hadoop/0 1
12 -C/0 1
19 -classpath/0 1
34 -cvf/0 1
43 -d/0 1
50 -mkdir/0 2
61 -put/0 2
70 ./0 1
76 /home/hadoop/hadoop/0 1
100 /home/hadoop/hadoopAssign/wordcount_classes/0 1
148 /wordcount/input/0 3
169 /wordcount/output/0 1
191 1)/0 1
198 2)/0 1
205 3)/0 1
212 4)/0 1
219 5/0 1
225 Assign/hadoop-core-1.1.2.jar/0 1
258 WordCount.java/0 1
277 and/0 1
285 copy/0 1
294 file01/0 2
305 file02/0 2
316 files/0 1
326 fs/0 3
333 fs/1 2
340 hadoop/0 3
351 hadoop/1 2
362 jar/0 2
370 javac/0 1
380 make/0 1
389 mkdir/0 1
399 org.myorg.WordCount/0 1
423 them/0 1
432 to/0 2
439 two/0 1
447 wordcount.jar/0 2
465 wordcount/0 1
479 wordcount/input/0 1
499 wordcount_classes//0 1
522 wordcount_classes/0 1
前几行的预期输出是这样的
)hadoop 1
-C 1
-classpath 1
-cvf 1
这正是我想要做的,但问题出在上面的程序中。我的最终目标是限制 Reducer 中可迭代值的大小。对于单词 hadoop 和 fs,我们将输出 5 和 5。在这里,我通过以某种方式对映射器进行分区将 reducer 值限制为 3,但我卡在了我的映射器中。所以/0、/1、/2 只是表示例如单词“hadoop”已经出现了 3 次,并且所以我们转到 hadoop/1 。这是在前面的 map reduce 程序中完成的,稍后我将介绍线性链。感谢任何帮助。
最佳答案
在 Hadoop 框架中,映射阶段被分配给一个映射器作业。这一个与您需要实现的特定接口(interface)相关联:Mapper。
此接口(interface)有一个名为 map 的独特方法,您需要实现该方法才能正确实现映射阶段。
您的代码中有错字 (map1)。更正它,用户已经解决了它的问题。
关于java - 映射器的意外输出。它在输出前添加一个数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25889053/
我之前让 dll 注入(inject)器变得简单,但我有 Windows 7,我用 C# 和 C++ 做了它,它工作得很好!但是现在当我在 Windows 8 中尝试相同的代码时,它似乎没有以正确的方
我正在尝试制作一个名为 core-splitter 的元素,该元素在 1.0 中已弃用,因为它在我们的项目中起着关键作用。 如果您不知道 core-splitter 的作用,我可以提供一个简短的描述。
我有几个不同的蜘蛛,想一次运行所有它们。基于 this和 this ,我可以在同一个进程中运行多个蜘蛛。但是,我不知道如何设计一个信号系统来在所有蜘蛛都完成后停止 react 器。 我试过了: cra
有没有办法在达到特定条件时停止扭曲 react 器。例如,如果一个变量被设置为某个值,那么 react 器应该停止吗? 最佳答案 理想情况下,您不会将变量设置为一个值并停止 react 器,而是调用
https://code.angularjs.org/1.0.0rc9/angular-1.0.0rc9.js 上面的链接定义了外部js文件,我不知道Angular-1.0.0rc9.js的注入(in
我正在尝试运行一个函数并将服务注入(inject)其中。我认为这可以使用 $injector 轻松完成.所以我尝试了以下(简化示例): angular.injector().invoke( [ "$q
在 google Guice 中,我可以使用函数 createInjector 创建基于多个模块的注入(inject)器。 因为我使用 GWT.create 在 GoogleGin 中实例化注入(in
我在 ASP.NET Core 1.1 解决方案中使用配置绑定(bind)。基本上,我在“ConfigureServices Startup”部分中有一些用于绑定(bind)的简单代码,如下所示: s
我在 Spring MVC 中设置 initBinder 时遇到一些问题。我有一个 ModelAttribute,它有一个有时会显示的字段。 public class Model { privat
我正在尝试通过jquery post发布knockoutjs View 模型 var $form = $('#barcodeTemplate form'); var data = ko.toJS(vm
如何为包含多态对象集合的复杂模型编写自定义模型绑定(bind)程序? 我有下一个模型结构: public class CustomAttributeValueViewModel { publi
您好,我正在尝试实现我在 this article 中找到的扩展方法对于简单的注入(inject)器,因为它不支持开箱即用的特定构造函数的注册。 根据这篇文章,我需要用一个假的委托(delegate)
你好,我想自动注册我的依赖项。 我现在拥有的是: public interface IRepository where T : class public interface IFolderReposi
我正在使用 Jasmine 测试一些 Angular.js 代码。为此,我需要一个 Angular 注入(inject)器: var injector = angular.injector(['ng'
我正在使用 Matlab 代码生成器。不可能包含代码风格指南。这就是为什么我正在寻找一个工具来“ reshape ”、重命名和重新格式化生成的代码,根据我的: 功能横幅约定 文件横幅约定 命名约定 等
这个问题在这里已经有了答案: Where and why do I have to put the "template" and "typename" keywords? (8 个答案) 关闭 8
我开发了一种工具,可以更改某些程序的外观。为此,我需要在某些进程中注入(inject)一个 dll。 现在我基本上使用这个 approach .问题通常是人们无法注入(inject) dll,因为他们
我想使用 swing、spring 和 hibernate 编写一个 java 应用程序。 我想使用数据绑定(bind)器用 bean 的值填充 gui,并且我还希望它反射(reflect) gui
我有这段代码,当两个蜘蛛完成后,程序仍在运行。 #!C:\Python27\python.exe from twisted.internet import reactor from scrapy.cr
要点是 Spring Batch (v2) 测试框架具有带有 @Autowired 注释的 JobLauncherTestUtils.setJob。我们的测试套件有多个 Job 类提供者。因为这个类不
我是一名优秀的程序员,十分优秀!