如何使用Spark Streaming Dataframe进行PCA

Aak*_*asu 5 pca spark-streaming pyspark apache-spark-ml

只是想知道,我们如何才能在分布式模式下对流数据进行主成分分析?如果可以的话,它在数学上是否足够有效?

有人做过吗?你们可以分享您的经验吗?Spark提供的API是否可以在Spark Streaming模式下执行相同的操作?