作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我编写了一个自定义分区程序,但无法将其设置到主类中的 JobConf
对象。
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Partitioner;
public class FirstCharTextPartitioner extends Partitioner<Text, Text> {
@Override
public int getPartition(Text key, Text value, int numReduceTasks) {
return (key.toString().charAt(0)) % numReduceTasks;
}
}
但是当我尝试将其设置为 JobConf
对象时,出现以下错误。
类型 JobConf 中的方法 setPartitionerClass(Class) 不适用于参数 (Class)
public class WordCount {
public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable> {
private final static IntWritable one = new IntWritable(1);
private Text word = new Text();
public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException {
String line = value.toString();
String[] tokens = line.split("\\s");
for (String token : tokens) {
word.set(token);
output.collect(word, one);
}
}
}
public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable> {
public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException {
int sum = 0;
while (values.hasNext()) {
sum += values.next().get();
}
output.collect(key, new IntWritable(sum));
}
}
public static void main(String[] args) throws Exception {
JobConf conf = new JobConf(WordCount.class);
conf.setJobName("wordcount");
conf.setOutputKeyClass(Text.class);
conf.setOutputValueClass(IntWritable.class);
conf.setMapperClass(Map.class);
conf.setCombinerClass(Reduce.class);
conf.setReducerClass(Reduce.class);
conf.setPartitionerClass(FirstCharTextPartitioner.class);
conf.setInputFormat(TextInputFormat.class);
conf.setOutputFormat(TextOutputFormat.class);
FileInputFormat.setInputPaths(conf, new Path(args[0]));
FileOutputFormat.setOutputPath(conf, new Path(args[1]));
JobClient.runJob(conf);
}
}
有人可以告诉我我做错了什么吗?
最佳答案
您正在导入新 org.apache.hadoop.mapreduce.Partitioner
。
您需要实现旧接口(interface) org.apache.hadoop.mapred.Partitioner
,如下所示:
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.Partitioner;
public class FirstCharTextPartitioner implements Partitioner<Text, Text> {
@Override
public int getPartition(Text key, Text value, int numReduceTasks) {
return (key.toString().charAt(0)) % numReduceTasks;
}
}
关于hadoop - 无法将 partitoner 设置为 JobConf 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14193646/
我很想了解 linux 文件系统布局。为什么该命令在虚拟框内有效,但在 Windows 上的 linux shell 上无效? 我尝试在我的虚拟盒子 (Ubuntu) 和 Windows 上的 Ubu
我编写了一个自定义分区程序,但无法将其设置到主类中的 JobConf 对象。 import org.apache.hadoop.io.Text; import org.apache.hadoop.ma
我是一名优秀的程序员,十分优秀!