hla*_*gos 5 snappy parquet apache-beam
我正在尝试使用 Snappy 压缩在 Apache Beam 中编写一个镶木地板文件,如下所示
records.apply(FileIO.<GenericRecord>write().via(ParquetIO.sink(schema)).to(options.getOutput()));
Run Code Online (Sandbox Code Playgroud)
我发现可以将AUTO、GZIP、BZIP2和设置为压缩,但我无法找到将其设置为 的方法,有什么想法如何做到这一点ZIP?作为参考,可以使用 wrting 到 avro,如下所示DEFLATESNAPPY
records.apply("writeAvro", AvroIO.writeGenericRecords(schema).withCodec(CodecFactory.snappyCodec()).to(options.getOutput()));
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
887 次 |
| 最近记录: |