小编Ram*_* KC的帖子

如何使用python开始在web Scrapy中编写单元测试？

class AljazeeraSpider(XMLFeedSpider):
    name = "aljazeera"
    allowed_domains = ["aljazeera.com"]
    start_urls = [
        'http://www.aljazeera.com/',
    ]

    def parse(self, response):
        hxs = HtmlXPathSelector(response)  # The xPath selector
        titles = hxs.select('//div[contains(@class,"SkyScrapperBoxes")]/div[contains(@class,"skyscLines")]')
        if not titles:
            MailNotify().send_mail("Aljazeera", "Scraper Report")

        items = []
        for titles in titles:
            item = NewsItem()
            item['title'] = escape(''.join(titles.select('a/text()').extract()))
            item['link'] = "http://www.aljazeera.com" + escape(''.join(titles.select('a/@href').extract()))
            item['description'] = ''
            item = Request(item['link'], meta={'item': item}, callback=self.parse_detail)
            items.append(item)

        return items

    def parse_detail(self, response):
        item = response.meta['item']
        sel = HtmlXPathSelector(response)
        detail = sel.select('//td[@class = "DetailedSummary"]')
        item['details'] = remove_html_tags(escape(''.join(detail.select('p').extract())))
        item['location'] …

Run Code Online (Sandbox Code Playgroud)

python unit-testing scrapy web-scraping scrapy-spider

Ram*_* KC

2015 01-16

8
推荐指数

1
解决办法

3503
查看次数

PHP正则表达式仅检查大写和数字

我编写的PHP代码使用Regular Expression检查字符串包含UPPER CASE和DIGITS仅的组合.我无法测试$ str.

$str = "ABCD1234";
if(preg_match('[A-Z0-9]', $str)){
    echo "yes";
 }else{
   echo "No";
}

Run Code Online (Sandbox Code Playgroud)

php preg-match

Ram*_* KC

2015 09-08

0
推荐指数

1
解决办法

1728
查看次数

标签统计

php ×1

preg-match ×1

python ×1

scrapy ×1

scrapy-spider ×1

unit-testing ×1

web-scraping ×1

如何使用python开始在web Scrapy中编写单元测试？

PHP正则表达式仅检查大写和数字

标签 统计

小编Ram_ KC的帖子

标签统计