小编New*_*an 的帖子

使用Apache Spark进行分布式Web爬网 - 可能吗?

当我参加一个关于网络挖掘的访谈时,我问到了一个有趣的问题.问题是,是否可以使用Apache Spark抓取网站?

我猜这有可能,因为它支持Spark的分布式处理能力.在采访之后我搜索了这个,但找不到任何有趣的答案.这可能与Spark有关吗?

web-crawler web apache-spark

12
推荐指数
3
解决办法
1万
查看次数

标签 统计

apache-spark ×1

web ×1

web-crawler ×1