Beautifulsoup 按类属性查找所有

Anu*_*Anu 1 beautifulsoup python-2.7

我有一个html代码如下:

<div class="_cFb">  
<div class="_XWk">Rabindranath Tagore</div>
</div>
Run Code Online (Sandbox Code Playgroud)

我使用以下 python 代码来提取文本内容:

soup.find_all('div', attrs={'class':'._XWk'})
Run Code Online (Sandbox Code Playgroud)

此代码返回空。但是,我可以访问不以下划线(_)开头的其他类属性。有什么想法可以提取标签文本吗?

And*_*Che 5

这有效:

>>> import bs4
>>> soup = bs4.BeautifulSoup('''<div class="_cFb">  
... <div class="_XWk">Rabindranath Tagore</div>
... </div>''', 'html.parser')
>>> soup.find_all('div', class_='_XWk')
[<div class="_XWk">Rabindranath Tagore</div>]
Run Code Online (Sandbox Code Playgroud)

在这里找到按类别搜索的方法:https://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-by-css-class

顺便说一句,lxml 框架也可用于解析 HTML,允许使用 CSS 选择器进行搜索。