美丽的汤第一个孩子在 thia html 网络抓取

Cyb*_*elp 1 html python beautifulsoup web-scraping

我在这里有一个示例 html http://cyberrule.netii.net/1.html 我想让我的第一代孩子尝试过这个

nav = soup.find( 'nav' )
child_li = nav.findAll("li", { "class" : "dropdown" })
Run Code Online (Sandbox Code Playgroud)

但这只给我提供了带有类别下拉列表的列表。列表底部缺失。我想将它们全部放入一个数组中以便逐步处理。

Bar*_*art 5

通过recursive=False参数来找到直接子代。

nav = soup.find( 'nav' )
child_li = nav.ul.find_all("li", recursive=False)
for c in child_li:
    print c.text
Run Code Online (Sandbox Code Playgroud)

https://www.crummy.com/software/BeautifulSoup/bs4/doc/#the-recursive-argument