是否可以将 Spark rdd 文本文件另存为 gzip?
我可以以某种方式运行它:combPrdGrp3.repartition(10).saveAsTextFile("Combined")并将其保存为 gzip 文件吗?
使用
import org.apache.hadoop.io.compress.GzipCodec
combPrdGrp3.repartition(10).saveAsTextFile("Combined", classOf[GzipCodec])
Run Code Online (Sandbox Code Playgroud)
或者
sc.hadoopConfiguration.setClass(FileOutputFormat.COMPRESS_CODEC, classOf[GzipCodec], classOf[CompressionCodec])
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
9687 次 |
| 最近记录: |