BeautifulSoup - 在父子标签上查找

use*_*143 2 html python beautifulsoup html-parsing

我正在使用bs4.

在HTML的汤中说:

<li><strong>some text</strong></li>
Run Code Online (Sandbox Code Playgroud)

我想做一个find_all能找到的.当然find_all('li')有效,但必须有一种方法来指定查找父子组合.

ale*_*cxe 7

我想CSS selectors你问的是:

soup.select('li > strong')
Run Code Online (Sandbox Code Playgroud)

这将找到所有strong标记的直接子li标记.

演示:

>>> from bs4 import BeautifulSoup
>>> data = "<li><strong>some text</strong></li>"
>>> soup = BeautifulSoup(data)
>>> soup.select('li > strong')
[<strong>some text</strong>]
Run Code Online (Sandbox Code Playgroud)