相关疑难解决方法(0)

Spark yarn cluster vs client - 如何选择使用哪一个?

spark 文档具有以下段落,它使纱线客户端和纱线簇之间的差异在下降:

有两种部署模式可用于在YARN上启动Spark应用程序.在集群模式下,Spark驱动程序在应用程序主进程内运行,该进程由群集上的YARN管理,客户端可以在启动应用程序后消失.在客户端模式下,驱动程序在客户端进程中运行,应用程序主服务器仅用于从YARN请求资源.

我假设有两个选择是有原因的.如果是这样,你如何选择使用哪一个?

请使用事实证明您的回答是正确的,以便此问题和答案符合stackoverflow的要求.

stackoverflow上有一些类似的问题,但是这些问题集中在两种方法之间的差异,但不关注何时一种方法比另一种方法更合适.

hadoop-yarn apache-spark

21
推荐指数
2
解决办法
2万
查看次数

Spark Driver内存和Application Master内存

我是否正确理解客户端模式的文档?

  1. 客户端模式是否与集群模式相对,驱动程序在应用程序主机中运行?
  2. 在客户端模式下,驱动程序和应用程序主机是独立的进程,因此spark.driver.memory+ spark.yarn.am.memory必须小于机器的内存?
  3. 在客户端模式下,驱动程序内存不包含在应用程序主内存设置中?

hadoop hadoop-yarn apache-spark

13
推荐指数
2
解决办法
3451
查看次数

标签 统计

apache-spark ×2

hadoop-yarn ×2

hadoop ×1