语境:
左边:
column_a: INT64 SNAPPY DO:0 FPO:4 SZ:5179987/6161135/1.19 VC:770100 ENC:PLAIN,RLE,BIT_PACKED
Run Code Online (Sandbox Code Playgroud)
正确的:
column_a: INT64 SNAPPY DO:0 FPO:4 SZ:3040269/5671813/1.87 VC:782499 ENC:BIT_PACKED,PLAIN,RLE,PLAIN_DICTIONARY
Run Code Online (Sandbox Code Playgroud)
我的问题:
parquet 如何确定要使用的编码类型以及什么可能使 parquet 选择不同的编码?我们可以使用 Hive / Spark 配置来控制它吗?