你如何使用python 2.6删除包括的所有内容 <div class="comment"> ....remove all ....</div>
我尝试了各种方式使用re.sub没有任何成功
谢谢
Aym*_*ieh 16
使用像BeautifulSoup这样的HTML解析器可以轻松可靠地完成此操作:
>>> from BeautifulSoup import BeautifulSoup
>>> soup = BeautifulSoup('<body><div>1</div><div class="comment"><strong>2</strong></div></body>')
>>> for div in soup.findAll('div', 'comment'):
... div.extract()
...
<div class="comment"><strong>2</strong></div>
>>> soup
<body><div>1</div></body>
Run Code Online (Sandbox Code Playgroud)
请参阅此问题,了解为什么使用正则表达式解析HTML是一个坏主意.
| 归档时间: |
|
| 查看次数: |
5801 次 |
| 最近记录: |