Snowflake PUT 命令,AUTO_COMPRESS 与 gzip 压缩文件性能

rak*_*ngh 3 snowflake-cloud-data-platform

有人可以建议使用 PUT 命令时以下哪个选项的性能更高:

  1. 使用 AUTO_COMPRESS=true 上传文件。
  2. 上传压缩文件(gzip) AUTO_COMPRESS=false。

Gre*_*lik 6

离开并没有什么坏处AUTO_COMPRESS=true,因为如果文件已经被压缩,PUT 命令不会尝试对其进行双重压缩。但有一个重要的警告需要注意。如果文件已被压缩,则必须使用支持的压缩方法对其进行压缩。您可以在此处获取支持的方法列表:https://docs.snowflake.com/en/sql-reference/sql/put.html

建议在之前或 auto_compress 中使用压缩,因为它将减少网络传输时间和带宽消耗。这将使用服务器上的 CPU 和 IO 来执行 PUT 操作。如果执行 PUT 的服务器已满(例如,我在超额订阅系统上见过一些虚拟机的情况),则最好在发送到执行 PUT 的计算机之前执行压缩。这是因为 PUT 操作已经占用了大量的 CPU 和 IO,因为它在上传之前对文件进行了加密。