Anu*_*nuj 1 html css python beautifulsoup web-scraping
我正在抓取一个包含两个相同类的“钩子”的 html 文档,如下所示:
<div class="multiRow">
<!--ModuleId 372329FileName @swMultiRowsContainer-->
<some more content>
</div>
<div class="multiRow">
<!--ModuleId 372330FileName @multiRowsContainer-->
<some more content>
</div>
Run Code Online (Sandbox Code Playgroud)
当我做:
mr = ct[0].find_all('div', {'class': 'multiRow'})
Run Code Online (Sandbox Code Playgroud)
我只从第一个获取内容 有没有办法访问第二个中的内容?
谢谢!
使用亚当·斯密的评论进行编辑。
参考我上面的评论,下面的代码:
from bs4 import BeautifulSoup as soup
a = "<div class=\"multiRow\"><!--ModuleId 372329FileName @swMultiRowsContainer-->Bye</div> <div class=\"multiRow\"><!--ModuleId 372330FileName @multiRowsContainer-->Hi</div>"
print soup(a).find_all("div",{"class":"multiRow"})[1]
Run Code Online (Sandbox Code Playgroud)
返回:
<div class="multiRow"><!--ModuleId 372330FileName @multiRowsContainer-->Hi</div>
Run Code Online (Sandbox Code Playgroud)