Pri*_*rua 2 python scrapy web-scraping scrapy-spider
我正在用草皮爬行。我正在获取网站的全部内容。
import scrapy
import os
class QuotesSpider(scrapy.Spider):
name = "team"
def start_requests(self):
yield scrapy.Request(url='http://*****.com', callback=self.get_scripts)
def get_scripts(self, response):
print response.css("body").extract()
def get_scripts(self, response):
print response.css("body").extract()
Run Code Online (Sandbox Code Playgroud)
现在我正在搜索文本,我可以通过python通过简单的搜索文本/子字符串来获取。我想要的是选择此文本匹配的选择器。请告知执行此操作的最佳方法是什么。
你可以做这样的事情。
import logging
logging.info(response.xpath("//*[contains(text(), 'MY TEXT')]"))
Run Code Online (Sandbox Code Playgroud)
这将打印出带有刮擦值和选择器的整个对象。
| 归档时间: |
|
| 查看次数: |
3929 次 |
| 最近记录: |