作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我在 Hadoop 中有一个 ImageInputFormat
类,它从 HDFS 读取图像。如何在 Spark 中使用我的 InputFormat?
这是我的ImageInputFormat
:
public class ImageInputFormat extends FileInputFormat<Text, ImageWritable> {
@Override
public ImageRecordReader createRecordReader(InputSplit split,
TaskAttemptContext context) throws IOException, InterruptedException {
return new ImageRecordReader();
}
@Override
protected boolean isSplitable(JobContext context, Path filename) {
return false;
}
}
最佳答案
SparkContext有一个名为 hadoopFile
的方法。它接受实现接口(interface) org.apache.hadoop.mapred.InputFormat
它的描述是“为具有任意输入格式的 Hadoop 文件获取 RDD”。
另请查看 Spark Documentation .
关于hadoop - 如何在 Apache Spark 中使用 Hadoop InputFormats?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21015641/
我是一名优秀的程序员,十分优秀!