ren*_*ior 6 amazon-s3 apache-spark parquet
只是想知道Parquet谓词下推是否也适用于S3,而不仅限于HDFS。具体来说,如果我们使用Spark(非EMR)。
进一步的解释可能会有所帮助,因为它可能涉及对分布式文件系统的理解。
小智 9
我本人对此很纳闷,所以我只是对其进行了测试。我们使用EMR集群和Spark 1.6.1。
结果:
有时间时,我将添加有关测试和结果的更多详细信息。
是的。过滤器下推不依赖于底层文件系统。它仅取决于spark.sql.parquet.filterPushdown过滤器的类型和类型(并非所有过滤器都可以下推)。
| 归档时间: |
|
| 查看次数: |
2674 次 |
| 最近记录: |