BeautifulSoup仅提取顶级标签

Question

我正在使用Python 3.4中的BeautifulSoup进行一些网络抓取.

现在我在学习过程中遇到了一个问题:我正在尝试从网页上获取一个表行,而我正在使用find_all()来获取它们,但是在表格内部 - 还有更多的表格,其中包含表格行!如何在BeautifulSoup中仅获取标签的顶级/第一级通用或特定元素？

# Retrieves all the row ('tr') tags in table
my_table.find_all('tr')

顺便说一句,这个问题是这个问题的重复(只有那里使用的编程语言是PHP):从html中仅提取第一级段落

Answer 1

显然在方法find_all()中有一个名为recursive的参数,默认情况下它设置为True.

将其设置为false,使该方法仅返回顶级元素.

find_all('tr', recursive=False)