有没有办法覆盖所述文件而不是附加它?
例)
scrapy crawl myspider -o "/path/to/json/my.json" -t json
scrapy crawl myspider -o "/path/to/json/my.json" -t json
Run Code Online (Sandbox Code Playgroud)
将附加my.json文件而不是覆盖它.
我有一个名为的变量pubdate,它源自 rss feed。大多数时候它是一个时间元组,这正是我想要的,所以没有错误。
有时它是一个 unicode 字符串,这就是令人烦恼的地方。
到目前为止,我有以下关于pubdate何时是 unicode 字符串的代码:
if isinstance(pubdate, unicode):
try:
pubdate = time.mktime(datetime.strptime(pubdate, '%d/%m/%Y %H:%M:%S').timetuple()) # turn the string into a unix timestamp
except ValueError:
pubdate = re.sub(r'\w+,\s*', '', pubdate) # removes day words from string, i.e 'Mon', 'Tue', etc.
pubdate = time.mktime(datetime.strptime(pubdate, '%d %b %Y %H:%M:%S').timetuple()) # turn the string into a unix timestamp
Run Code Online (Sandbox Code Playgroud)
但我的问题是,如果 unicode 字符串的格式pubdate与子句中的格式不同,except ValueError它将引发另一个ValueError,处理多种ValueError情况的 pythonic 方法是什么?