Sam*_*lam 3 scrapy web-scraping scrapy-shell
我正在尝试废弃一个网站,但在运行脚本时,出现以下错误
'NotSupported:不支持的 URL 方案'':没有可用于该方案的处理程序'
如果规则没有错误,为什么会出现这种情况以及您的建议是什么,请帮助我。多谢。
代码在这里:
from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor
class FellowSearch(CrawlSpider):
name ='fellow'
allowed_domains = ['emma.cam.ac.uk']
start_urls = [' https://www.emma.cam.ac.uk/']
rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)
def parse_obj(self, response):
print response.url
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
6664 次 |
最近记录: |