我想知道 Python 中是否有库或某种方法可以从 HTML 文档中提取元素。例如:
我有这个文件:
<html>
<head>
...
</head>
<body>
<div>
...
</div>
</body>
</html>Run Code Online (Sandbox Code Playgroud)
我想<div></div>从文档中删除标签块以及块内容,然后它会像这样:
<html>
<head>
...
</head>
<body>
</body>
</html>Run Code Online (Sandbox Code Playgroud)