spark 文档具有以下段落,它使纱线客户端和纱线簇之间的差异在下降:
有两种部署模式可用于在YARN上启动Spark应用程序.在集群模式下,Spark驱动程序在应用程序主进程内运行,该进程由群集上的YARN管理,客户端可以在启动应用程序后消失.在客户端模式下,驱动程序在客户端进程中运行,应用程序主服务器仅用于从YARN请求资源.
我假设有两个选择是有原因的.如果是这样,你如何选择使用哪一个?
请使用事实证明您的回答是正确的,以便此问题和答案符合stackoverflow的要求.
stackoverflow上有一些类似的问题,但是这些问题集中在两种方法之间的差异,但不关注何时一种方法比另一种方法更合适.
我是否正确理解客户端模式的文档?
spark.driver.memory+ spark.yarn.am.memory必须小于机器的内存?