Pan*_*ias 7 machine-learning cassandra apache-spark
我有一些与使用Apache Spark进行实时分析相关的问题.提交Spark应用程序时,存储在Cassandra数据库中的数据将通过机器学习算法(支持向量机)加载和处理.在新数据到达时,通过Spark的流式传输扩展,它们将保留在数据库中,重新训练现有数据集并执行SVM算法.此过程的输出也存储在数据库中.
分段回答你的问题,
从文档中,
.. 除了拟合发生在每批数据上,以便模型不断更新以反映流中的数据。
| 归档时间: |
|
| 查看次数: |
1409 次 |
| 最近记录: |