我正在尝试使用Universal Feed Parser从我的Django网站上获取外部源的内容.我希望有一些用户错误处理,例如,如果用户提供的URL不是Feed.当我尝试feedparser如何响应错误的输入时,我惊讶地发现feedparser根本没有抛出任何异常.例如,在HTML内容上,它尝试从HTML代码中解析一些信息,在非现有域上,它返回一个基本上为空的字典:
{'bozo': 1,
'bozo_exception': URLError(gaierror(-2, 'Name or service not known'),),
'encoding': 'utf-8',
'entries': [],
'feed': {},
'version': None}
Run Code Online (Sandbox Code Playgroud)
其他错误输入在返回的字典中status_code的namespaces值或值中显示.
那么,如何在不诉诸无尽级联的情况下进行合理的错误检查的最佳方法是if .. elif .. elif ...什么?
根据feedparser文档,在Bozo Detection部分:
Universal Feed Parser可以解析Feed,无论它们是否是格式良好的XML.但是,由于某些应用程序可能希望拒绝或警告用户有关非格式化的进给,因此Universal Feed Parser会在检测到进给不良的情况下设置bozo位.
(在我看来,捕获所有异常并以另一种形式返回它们并不是一个很好的做法,但这只是它的工作方式,因为"应用程序可能只是警告不良格式的提要".)
因此,在尝试解析任何URL的Feed后,您可以检查"bozo位"并重新引发相应的异常:
f = feedparser.parse('http://example.com')
if f.bozo:
raise f.bozo_exception
Run Code Online (Sandbox Code Playgroud)
您可以根据类型和消息处理异常,或者通过对返回的对象的其他属性进行断言feedparser.parse(例如:f.feed必须为非空,f.status必须等于200,f.entries必须为非空,f.version必须是有效的提要格式版本等),无论你的应用程序看起来最合理.
| 归档时间: |
|
| 查看次数: |
2163 次 |
| 最近记录: |