use*_*022 5 html python forms beautifulsoup html-parsing
我正在尝试BeautifulSoup仅用于提取特定表单的输入字段。
使用以下方法提取表单:
soup.find('form')
Run Code Online (Sandbox Code Playgroud)
现在我想提取所有属于该表单的子项的输入字段。
我怎样才能用 BS 做到这一点?
如评论中所述,链find和find_all()特定于上下文的搜索:
form = soup.find('form')
inputs = form.find_all('input')
Run Code Online (Sandbox Code Playgroud)
如果您input只想要直接元素,请添加recursive=False:
form.find_all('input', recursive=False)
Run Code Online (Sandbox Code Playgroud)
或者,使用CSS 选择器:
soup.select("form input")
Run Code Online (Sandbox Code Playgroud)
并且,input仅获取直接子元素:
soup.select("form > input")
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
10639 次 |
| 最近记录: |