在 Hive 2.2.0 上,我使用查询从另一个大小为 1.34 GB 的源表填充 orc 表
INSERT INTO TABLE TableOrc SELECT * FROM Table; ---- (1)
Run Code Online (Sandbox Code Playgroud)
该查询创建包含 6 个 orc 文件的 TableORC 表,这些文件比 256MB 的块大小小得多。
-- FolderList1
-rwxr-xr-x user1 supergroup 65.01 MB 1/1/2016, 10:14:21 AM 1 256 MB 000000_0
-rwxr-xr-x user1 supergroup 67.48 MB 1/1/2016, 10:14:55 AM 1 256 MB 000001_0
-rwxr-xr-x user1 supergroup 66.3 MB 1/1/2016, 10:15:18 AM 1 256 MB 000002_0
-rwxr-xr-x user1 supergroup 63.83 MB 1/1/2016, 10:15:41 AM 1 256 MB 000003_0
-rwxr-xr-x user1 …Run Code Online (Sandbox Code Playgroud)