小编Jak*_*ght的帖子

Beautiful Soup 只提取一个标签,而可以在 html 代码中看到所有其他标签

尝试了解网络抓取的工作原理:

import requests
from bs4 import BeautifulSoup as soup
url = "https://webscraper.io/test-sites/e-commerce/allinone/computers/laptops"
result = requests.get(url)
doc = soup(result.text, "lxml")
items = doc.find_all('div', {'class': 'col-sm-4 col-lg-4 col-md-4'})
for item in items:
    caption = item.find('div', {'class': 'caption'})
    price = item.find('h4', {'class': 'pull-right price'})
print(price.string)
Run Code Online (Sandbox Code Playgroud)

然而,当我运行此命令时,所有返回的都是网站的最终价格(1799.00 美元)。为什么它会跳过所有其他 h4 标签并只返回最后一个?

任何帮助将非常感激!

如果您需要更多信息,请告诉我

python lxml beautifulsoup html-parsing web-scraping

2
推荐指数
1
解决办法
97
查看次数

标签 统计

beautifulsoup ×1

html-parsing ×1

lxml ×1

python ×1

web-scraping ×1