我想知道为什么当按列而不是排序键或排序键的一部分进行选择时,从一个大表(> 1000亿行)中卸载对于新添加的数据而言极大地快。Redshift如何理解是时候在第二种情况下停止顺序扫描了?
查询花费在执行上的时间。39m 37.02s:
UNLOAD ('SELECT * FROM production.some_table WHERE daytime BETWEEN
\\'2017-01-15\\' AND \\'2017-01-16\\'') TO ...
Run Code Online (Sandbox Code Playgroud)
与
查询花费在执行上的时间。23.01秒:
UNLOAD ('SELECT * FROM production.some_table WHERE daytime BETWEEN
\\'2017-06-24\\' AND \\'2017-06-25\\'') TO ...
Run Code Online (Sandbox Code Playgroud)
谢谢!