据我所知,MapR只是一个"更快"的Hadoop.没有包含算法.
所以你的工作应该兼容.
但实施自己的协议是什么?K-means非常简单.请参阅我的博客文章:http: //codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html
但是我已经实现了一个带有BSP(批量同步并行)和Apache Hama的k-means集群,如果你将它与本书中的Mahout基准测试结果进行比较,它几乎要快十倍:http://www.manning.com/ingersoll/(链接jira:https://issues.apache.org/jira/browse/MAHOUT-588)以下是Apache Hama的k-means基准:http://wiki.apache.org/hama/Benchmarks
你可以在这里找到它:https: //github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java
| 归档时间: |
|
| 查看次数: |
466 次 |
| 最近记录: |