我如何使用wget下载scrapy文件

Question

我如何使用wget下载scrapy文件

scrapy没有正确下载文件.我有我的项目的URL,所以我想我可以使用wget下载文件.

如何在scrapy process_item函数中使用wget ？或者,还有另一种下载文件的方式吗？

class MyImagesPipeline(ImagesPipeline):
    #Name download version
    def image_key(self, url):
        image_guid = url.split('/')[-1]
        return 'full/%s' % (image_guid)

    def get_media_requests(self, item, info):
        if item['image_urls']:
            for image_url in item['image_urls']:
            # wget -nH image_ul -P  images/
            yield Request(image_url)

Run Code Online (Sandbox Code Playgroud)

Answer 1

fur*_*ins 4

此代码将执行 wget，您可以将注释替换为以下行

import subprocess

    ...

subprocess.call(['wget','-nH', image_url, '-P  images/'])

Run Code Online (Sandbox Code Playgroud)

您可以在此处阅读有关 subprocess.call 的信息：http://docs.python.org/2/library/subprocess.html

归档时间：	13 年，1 月前
查看次数：	1156 次
最近记录：	13 年，1 月前