use*_*031 5 python wget scrapy
scrapy没有正确下载文件.我有我的项目的URL,所以我想我可以使用wget下载文件.
如何在scrapy process_item函数中使用wget ?或者,还有另一种下载文件的方式吗?
class MyImagesPipeline(ImagesPipeline):
#Name download version
def image_key(self, url):
image_guid = url.split('/')[-1]
return 'full/%s' % (image_guid)
def get_media_requests(self, item, info):
if item['image_urls']:
for image_url in item['image_urls']:
# wget -nH image_ul -P images/
yield Request(image_url)
Run Code Online (Sandbox Code Playgroud)
此代码将执行 wget,您可以将注释替换为以下行
import subprocess
...
subprocess.call(['wget','-nH', image_url, '-P images/'])
Run Code Online (Sandbox Code Playgroud)
您可以在此处阅读有关 subprocess.call 的信息:http://docs.python.org/2/library/subprocess.html
| 归档时间: |
|
| 查看次数: |
1156 次 |
| 最近记录: |