美丽的汤 - 捕获与某个类或文本的所有链接

Question

美丽的汤 - 捕获与某个类或文本的所有链接

我正试图从一个美丽的汤的网页捕获所有相关链接.我需要的所有链接都包含class="btn btn-gray"文本和文本<a...>More Info<>

提取这些链接的最佳方法是什么？

Answer 1

这个怎么样？

soup = BeautifulSoup(html, 'lxml')

all_links = []
links = soup.find_all('a', {'class': ['btn', 'btn-gray']})
for link in links:
    if 'More Info' in link.text:
        all_links.append(link['href'])  # Save href only, for example.

Run Code Online (Sandbox Code Playgroud)

或者作为一个干净的清单理解:

links = soup.find_all('a', {'class': ['btn', 'btn-gray']})
results = [link['href'] for link in links if 'More Info' in link.text]

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，1 月前
查看次数：	1497 次
最近记录：	8 年，10 月前