heq*_*128 11 hadoop hdfs apache-spark
我ImageInputFormat在Hadoop中有一个类从HDFS读取图像.如何在Spark中使用我的InputFormat?
这是我的ImageInputFormat:
public class ImageInputFormat extends FileInputFormat<Text, ImageWritable> {
@Override
public ImageRecordReader createRecordReader(InputSplit split,
TaskAttemptContext context) throws IOException, InterruptedException {
return new ImageRecordReader();
}
@Override
protected boolean isSplitable(JobContext context, Path filename) {
return false;
}
}
Run Code Online (Sandbox Code Playgroud)
Rob*_*ger 14
该SparkContext有一个名为方法hadoopFile.它接受实现接口的类org.apache.hadoop.mapred.InputFormat
它的描述是"使用任意InputFormat为Hadoop文件获取RDD".
另请参阅Spark文档.
| 归档时间: |
|
| 查看次数: |
10367 次 |
| 最近记录: |