有时,我想解析HTML以提取URL.
我找到了[html.parser.HTMLParser],[re.match]都可以做到这一点.
我想知道哪个更快.
是否有像jquery解析HTML 的python模块?
如果您有更好的解决方案,请发表评论.
谢谢
lxml非常好.它使工作变得非常简单.
>>>for url in parse(urlopen('http://www.stackoverflow.com')).getroot().find_class('question-hyperlink'): print(url.get('href'))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
143 次 |
| 最近记录: |