小编use*_*550的帖子

从中提取RSS Feed网址

我有100个网站在不同的位置暴露RSS源.这些位置有几个指向不同Feed的RSS提要链接.它几乎与BBC Rss供稿页面 http://www.bbc.com/news/10628494相同

站点1:domain1.com/rss站点2:domain2.com/enviroments/rss

有没有办法提取出每个feed xml的rss链接.

类似于这个 自动提取来自网页的提要链接(原子,rss等),但我想只提供该网站.这样我就可以获得特定网站的所有可能的RSS源.

我想要列出100个网站的所有RSS源.那么我就可以在仪表板上监控它们.哦饲料aee混合bith原子和rss.

我做了什么.我查看了apache nutch和parse-feed插件.Scrapy是下一个选择,但我仍然不确定这是我在寻找什么.

rss web-crawler feed scraper atom-feed

2
推荐指数
1
解决办法
5560
查看次数

标签 统计

atom-feed ×1

feed ×1

rss ×1

scraper ×1

web-crawler ×1