你能否告诉我Apache Spark和AKKA之间的区别,我知道这两个框架都意味着编程分布式和并行计算,但我没有看到它们之间的链接或区别.
此外,我想得到适合他们每个人的用例.
parallel-processing distributed-computing bigdata akka apache-spark
我构建了一个从Twitter接收DStreams的应用程序,停止Streaming上下文的唯一方法就是停止执行.我想知道是否有办法设置时间并终止流式套接字而不停止整个应用程序?
我想使用我自己的损失函数代替Spark MLlib中的线性回归模型的平方损失。到目前为止,在文档中找不到任何可能的部分。
scala regression machine-learning apache-spark apache-spark-mllib