- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在新的 API (apache.hadoop.mapreduce.KeyValueTextInputFormat) 中,如何指定除制表符(默认)之外的分隔符(定界符)来分隔键和值。
示例输入:
one,first line
two,second line
需要输出:
Key : one
Value : first line
Key : two
Value : second line
我将 KeyValueTextInputFormat 指定为:
Job job = new Job(conf, "Sample");
job.setInputFormatClass(KeyValueTextInputFormat.class);
KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
这对于作为分隔符的制表符来说效果很好。
最佳答案
在较新的 API 中,您应该使用 mapreduce.input.keyvaluelinerecordreader.key.value.separator
配置属性。
这是一个例子:
Configuration conf = new Configuration();
conf.set("mapreduce.input.keyvaluelinerecordreader.key.value.separator", ",");
Job job = new Job(conf);
job.setInputFormatClass(KeyValueTextInputFormat.class);
// next job set-up
关于java - 如何在 Hadoop-.20 api 中指定 KeyValueTextInputFormat 分隔符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9211151/
在新的API(apache.hadoop.mapreduce.KeyValueTextInputFormat)中,如何指定除制表符(默认)之外的分隔符(定界符)来分隔键和值。 示例输入: 106298
我正在尝试读取包含以下格式行的文件。 100,1:2:3200,10:20:30 假设输入总是数字,我试图通过将输入键和值分别设置为 IntWritable 和 Text 来读取文件。但是当我运行它时
我使用 hadoop 1.0.1 做一些项目,我想让我的输入 .txt 文件成为“关键”并且我需要的“值(value)”,例如: 如果我有一个test.txt文件,文件内容是 1, 10 10 我想我
我的输入文件是这样的: Key1 : Value1,Value2 Ket2 : Value3,Value4 在映射器中,我想获得一个键,其中“:”是定界符。为此,我的代码是这样的: JobConf c
谁能给我一个我们必须使用 KeyValueTextInputFormat 和 TextInputFormat 的实际场景?? 最佳答案 TextInputFormat 类将源文件的每一行转换为键/值类
在新的 API (apache.hadoop.mapreduce.KeyValueTextInputFormat) 中,如何指定除制表符(默认)之外的分隔符(定界符)来分隔键和值。 示例输入: one
我是一名优秀的程序员,十分优秀!