use*_*143 2 html python beautifulsoup html-parsing
我正在使用bs4.
在HTML的汤中说:
<li><strong>some text</strong></li>
Run Code Online (Sandbox Code Playgroud)
我想做一个find_all能找到的.当然find_all('li')有效,但必须有一种方法来指定查找父子组合.
我想CSS selectors你问的是:
soup.select('li > strong')
Run Code Online (Sandbox Code Playgroud)
这将找到所有strong标记的直接子li标记.
演示:
>>> from bs4 import BeautifulSoup
>>> data = "<li><strong>some text</strong></li>"
>>> soup = BeautifulSoup(data)
>>> soup.select('li > strong')
[<strong>some text</strong>]
Run Code Online (Sandbox Code Playgroud)