我正在寻找一种方法来使用findAll按照它们在页面上显示的顺序获取两个标签.
目前我有:
import requests
import BeautifulSoup
def get_soup(url):
request = requests.get(url)
page = request.text
soup = BeautifulSoup(page)
get_tags = soup.findAll('hr' and 'strong')
for each in get_tags:
print each
Run Code Online (Sandbox Code Playgroud)
如果我在一个只有'em'或'strong'的页面上使用它,那么它将为我提供所有这些标签,如果我在两者上使用它将获得'强'标签.
有没有办法做到这一点?我主要关注的是保留标签的查找顺序.
我想选择所有将A和B分别作为类属性的div.
以下选择
soup.findAll('div', class_=['A', 'B'])
Run Code Online (Sandbox Code Playgroud)
但是选择在其类属性中具有EITHER A或B的所有div.类可以有任何顺序的许多其他属性(C,D等),但我想只选择那些同时具有A和B的属性.