col*_*ine 8 html python beautifulsoup web-scraping python-3.x
我正在使用Python 3.4中的BeautifulSoup进行一些网络抓取.
现在我在学习过程中遇到了一个问题:我正在尝试从网页上获取一个表行,而我正在使用find_all()来获取它们,但是在表格内部 - 还有更多的表格,其中包含表格行!如何在BeautifulSoup中仅获取标签的顶级/第一级通用或特定元素?
# Retrieves all the row ('tr') tags in table
my_table.find_all('tr')
Run Code Online (Sandbox Code Playgroud)
顺便说一句,这个问题是这个问题的重复(只有那里使用的编程语言是PHP):从html中仅提取第一级段落
col*_*ine 14
显然在方法find_all()中有一个名为recursive的参数,默认情况下它设置为True.
将其设置为false,使该方法仅返回顶级元素.
find_all('tr', recursive=False)
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
3974 次 |
最近记录: |