小编Des*_*ond的帖子

使用 BeautifulSoup 删除 <p> 标签内的空格

我的字符串 html 中有一些段落如下所示:

<p>
    Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
</p>
Run Code Online (Sandbox Code Playgroud)

我想删除标签内的空白p并将其变成:

<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua</p>
Run Code Online (Sandbox Code Playgroud)

请注意,p像这样的标签应该保持更改:

<p class="has-media media-640"><img alt="Lorem ipsum dolor sit amet" height="357" src="http://www.example.com/img/lorem.jpg" width="636"/></p>
Run Code Online (Sandbox Code Playgroud)

我想要的是:

for p in soup.findAll('p'):
    replace p.string with trimmed text
Run Code Online (Sandbox Code Playgroud)

html python trim beautifulsoup

2
推荐指数
1
解决办法
4028
查看次数

标签 统计

beautifulsoup ×1

html ×1

python ×1

trim ×1