在 Livy PySpark 的 HDFS 中存储 Python 包

dan*_*ste 5 python apache-spark pyspark livy

我通过 Livy 向集群提交 PySpark 作业。目前,NumPy、Pandas、Keras 等依赖的 python 包已安装在所有数据节点上。想知道是否所有这些包都可以集中存储在 HDFS 中,以及如何配置 Livy、PySpark 从 HDFS 而不是从该数据节点读取这些包。