自动从网页中提取Feed链接(atom,rss等)

Max*_*Max 4 python api rss feed atom-feed

我有一个庞大的URL列表,我的任务是将它们提供给python脚本,如果有的话,它应该吐出feed url.是否有可以提供帮助的API库或代码?

Dav*_*one 7

feedfinder:

>>> import feedfinder
>>>
>>> feedfinder.feed('scripting.com')
'http://scripting.com/rss.xml'
>>>
>>> feedfinder.feeds('scripting.com')
['http://delong.typepad.com/sdj/atom.xml', 
 'http://delong.typepad.com/sdj/index.rdf', 
 'http://delong.typepad.com/sdj/rss.xml']
>>>
Run Code Online (Sandbox Code Playgroud)