小编rar*_*777的帖子

如何使用BeautifulSoup查找HTML页面中<p>元素内的所有文本

我需要在Python中使用BeautifulSoup查找HTML文件中段落元素内的所有可见标记.
例如,
<p>Many hundreds of named mango <a href="/wiki/Cultivar" title="Cultivar">cultivars</a> exist.</p>
应该返回:
Many hundreds of cultivars exist.

PS某些文件包含需要提取的Unicode字符(印地语).
任何想法如何做到这一点?

python unicode beautifulsoup html-parsing

1
推荐指数
2
解决办法
1万
查看次数

标签 统计

beautifulsoup ×1

html-parsing ×1

python ×1

unicode ×1