ana*_*and 1 google-cloud-dataflow google-cloud-dataproc
DataFlow本身有ETL,计算和流媒体处理为什么我们需要去谷歌的Dataproc?
Google Dataflow是一种完全托管和自我优化的云服务,可让您使用Apache Beam编程模型编写批处理和流数据处理管道.它与许多开源和Google Cloud数据源和接收器集成在一起.
Google Dataproc是一种完全托管的云服务,用于以简单经济的方式运行Apache Hadoop和Apache Spark群集.如果您有使用Spark,Hive或Pig的现有数据处理管道,这是一种快速简便的移动管道的方法.您可以随时安装自定义程序包,启动/停止和缩放这些群集.最重要的是,Google Dataproc与许多Google云端数据服务集成在一起.
| 归档时间: |
|
| 查看次数: |
2004 次 |
| 最近记录: |