Sha*_*atu 8 hadoop mapreduce graph social-networking graph-algorithm
我需要为庞大的数据集找到连接的组件.(图形未指向)
一个显而易见的选择是MapReduce.但我是MapReduce的新手,我很安静,没时间去挑选它并自己编写代码.
我只是想知道是否有任何现有的API,因为它是社交网络分析中一个非常常见的问题?
或者至少如果有人知道任何可靠(经过试验和测试)的来源,至少我可以自己开始实施吗?
谢谢
我为自己写了一篇博文:
http://codingwiththomas.blogspot.de/2011/04/graph-exploration-with-hadoop-mapreduce.html
但MapReduce不适合这些Graph分析.为此更好地使用BSP(批量同步并行),Apache Hama在Hadoop HDFS之上提供了一个很好的图形API.
我在这里用MapReduce编写了一个连通组件算法:( Mindist搜索)
https://github.com/thomasjungblut/tjungblut-graph/tree/master/src/de/jungblut/graph/mapreduce
此外,还可以在此处找到Apache Hama的BSP版本:
实现并不像MapReduce那样困难,并且速度至少快10倍.如果您有兴趣,请查看TRUNK的最新版本并访问我们的邮件列表.
http://apache.org/hama/mail-lists.html