小编San*_*wal的帖子

提取两个不同标签之间的文本美丽汤

我正在尝试从此网页中提取文章的文本内容。

我只是想提取文章内容,而不是“关于作者部分”。

问题是所有内容都不在像<div>. 因此我无法提取它们,因为它们都在<p>标签内。当我提取所有<p>标签时,我也会得到“关于作者”部分。我必须从这个网站上抓取很多页面。有没有办法用漂亮的汤来做到这一点?

我目前正在尝试:

p_tags=soup.find_all('p')
for row in p_tags:
    print(row)
Run Code Online (Sandbox Code Playgroud)

html python beautifulsoup web-scraping python-3.x

6
推荐指数
1
解决办法
5624
查看次数

标签 统计

beautifulsoup ×1

html ×1

python ×1

python-3.x ×1

web-scraping ×1