Ale*_*hew 2 java parallel-processing distributed-computing web-crawler
在Java中开发时,并行系统或分布式系统是否更适合网站爬虫和Web索引器?有哪些框架?
Nik*_*aos 6
你会发现Java最好的爬虫/索引器组合之一是Nutch,它现在是一个Apache项目(参见Wiki),因此是开源的.
特征:
归档时间:
15 年,6 月 前
查看次数:
308 次
最近记录:
13 年,11 月 前