使用Java API将Parquet格式写入HDFS,而不使用Avro和MR

Kri*_*has 5 java hadoop hdfs parquet

什么是写简单的方式镶木格式HDFS通过(使用Java API)直接创建平面架构一个POJO的,不使用的AvroMR

我发现的样本已经过时,使用弃用的方法也使用了Avro,spark或MR中的一种.

loi*_*ieu 5

实际上,没有很多样本可用于在没有外部框架的帮助下读取/编写Apache镶木地板文件.

核心镶木地板库是镶木地板,您可以在其中找到一些直接读/写的测试文件:https://github.com/apache/parquet-mr/blob/master/parquet-column/src/test/java/org/阿帕奇/拼花/ IO/TestColumnIO.java

然后,您只需要使用与HDFS文件相同的功能.您可以按照以下SOW问题:使用Java访问HDFS中的文件

更新:响应API的弃用部分:AvroWriteSupport应该被AvroParquetWriter取代,我检查ParquetWriter它不被弃用,可以安全使用.

问候,

卢瓦克