use*_*837 2 google-cloud-platform google-kubernetes-engine pyspark google-cloud-dataproc
我们的组织最近将其基础架构从aws迁移到了谷歌云计算,我认为数据集群是运行现有火花作业的一个很好的解决方案.但是当谈到定价时,我也意识到我可以启动一个google kubernetes引擎集群并在其中安装spark来运行spark应用程序.
现在我的问题是,如何"在gke上运行spark"并使用dataproc比较?在自动扩展,定价和基础设施方面,哪一个是最佳选择.我已经阅读了关于gke和dataproc的googles文档,但是在使用GKE或dataproc优于另一个的优点和缺点方面还不够.
任何专家意见都会非常有帮助.
提前致谢.
在上面的答案中添加我的两分钱。
| 归档时间: |
|
| 查看次数: |
523 次 |
| 最近记录: |