小编WR1*_*R10的帖子

我必须在Hadoop的Map Reduce程序中解析HDFS中的PDF文件.所以我从HDFS获取PDF文件作为输入拆分,它必须被解析并发送到Mapper类.为了实现这个InputFormat,我已经通过了这个链接.如何解析这些输入拆分并将其转换为文本格式？

5
推荐指数

1
解决办法

8615
查看次数

pdf ×1

小编WR1_R10的帖子