我正在对 ZFS 进行一些研究,如果它可以用作分布式处理框架的组件。我要回答的主要问题是 - 如果数据驻留在 zfs 中,Apache Spark 是否会以高效的分布式方式运行?
IE。HDFS 上的 Spark 有数据局部性的概念,ZFS 也可以这样说。
zfs distributed-computing apache-spark
apache-spark ×1
distributed-computing ×1
zfs ×1