如何在hadoop中读取.deflate文件

Him*_*ala 15 hadoop

我有一些pigpart-r-00000.deflate扩展名的生成文件.我知道这是一个压缩文件.如何以可读格式生成普通文件.当我使用时hadoop fs -text,我无法获得纯文本输出.输出仍然是二进制的.我该如何解决这个问题?

Lor*_*dig 20

您可能正在使用一个非常古老的 Hadoop版本(例如:0.20.0),其中fs -text无法使压缩文件膨胀.

作为一种解决方法,您可以尝试这种单线程(基于答案):

hadoop fs -text file.deflate | perl -MCompress::Zlib -e 'undef $/; print uncompress(<>)'
Run Code Online (Sandbox Code Playgroud)


gui*_*nol 14

您可以使用此命令动态解压缩

hdfs dfs -text file.deflate | hdfs dfs -put - uncompressed_destination_file