作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想这样做:protobuf->字节数组-> | HTTP post | ->字节数组->序列化为本地文件-> Hadoop中的MapReduce。
最佳答案
好的,问题现在已经解决。
org.apache.hadoop.io.SequenceFile.Writer为我工作。
Configuration conf = new Configuration();
LocalFileSystem fs = FileSystem.getLocal(conf);
SequenceFile.Writer writer = SequenceFile.createWriter(fs, conf, new Path("~/test"), LongWritable.class, BytesWritable.class);
LongWritable key = new LongWritable(1L);
BytesWritable val = new BytesWritable(protobufObject.toByteArray());
writer.append(key, val);
writer.close();
关于hadoop - 如何使用SequenceFileInputFormat将字节数组序列化为本地文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20703541/
我使用 SequenceFileInputFormat 作为我的 map 输入,其中键是文本,值是文本。共有 106 个文件,每个文件的大小在 500 MB 到 750 MB 之间。我查看了我的日志,
我正在尝试理解一个示例 hadoop 项目。它有以下代码块 jconf.setOutputKeyClass(Text.class); jconf.setOutputValueClass(Text.cl
我正在尝试运行电子书 Mahout in Action 中第 6 章( list 6.1 ~ 6.4)中的推荐系统示例。有两个映射器/缩减器对。这是代码: 映射器 - 1 public class W
我希望能够创建一个自定义的 InputFormat 来读取序列文件,但另外公开记录所在文件中的文件路径和偏移量。 退后一步,这里是用例:我有一个包含可变大小数据的序列文件。键大多是无关紧要的,值高达几
我是一名优秀的程序员,十分优秀!