小编New_an 的帖子

使用Apache Spark进行分布式Web爬网 - 可能吗？

当我参加一个关于网络挖掘的访谈时,我问到了一个有趣的问题.问题是,是否可以使用Apache Spark抓取网站？

我猜这有可能,因为它支持Spark的分布式处理能力.在采访之后我搜索了这个,但找不到任何有趣的答案.这可能与Spark有关吗？

web-crawler web apache-spark

12
推荐指数

3
解决办法

1万
查看次数

标签统计

apache-spark ×1

web ×1

web-crawler ×1