Python中的HTML解析器

Tei*_*ion 7 python import

使用Python文档我找到了HTML解析器,但我不知道要导入哪个库来使用它,我如何找到它(记住它没有在页面上说明).

Vin*_*vic 23

您可能真的想要BeautifulSoup,请查看链接以获取示例.

但无论如何

>>> import HTMLParser
>>> h = HTMLParser.HTMLParser()
>>> h.feed('<html></html>')
>>> h.get_starttag_text()
'<html>'
>>> h.close()
Run Code Online (Sandbox Code Playgroud)


107*_*077 15

尝试:

import HTMLParser
Run Code Online (Sandbox Code Playgroud)

在Python 3.0中,HTMLParser模块已重命名为html.parser,您可以在此处查看

Python 3.0

import html.parser
Run Code Online (Sandbox Code Playgroud)

Python 2.2及以上版本

import HTMLParser
Run Code Online (Sandbox Code Playgroud)