小编use*_*725的帖子

找到下一个兄弟姐妹,直到某个人使用beautifulsoup

网页是这样的:

<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>

<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
Run Code Online (Sandbox Code Playgroud)

如何在其中找到包含文章的每个部分?也就是说,找到h2后,找到nextsiblings

直到下一个h2.

如果网页如下:(通常情况下)

<div>
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>

<div>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
Run Code Online (Sandbox Code Playgroud)

我可以编写如下代码:

for section in soup.findAll('div'):
...
    for post in section.findAll('p')
Run Code Online (Sandbox Code Playgroud)

但是,如果我想获得相同的结果,我应该如何处理第一个网页?

python beautifulsoup find siblings scrape

8
推荐指数
1
解决办法
2万
查看次数

标签 统计

beautifulsoup ×1

find ×1

python ×1

scrape ×1

siblings ×1