@ayivima 有一个很好的答案,但我应该补充一点,该网站本身最终没有被 BeautifulSoup 正确抓取,因为它有大量的 Javascript。
所以我对使用Python完全陌生,我只是想打印网页的标题。我主要使用来自谷歌的代码:
from bs4 import BeautifulSoup, SoupStrainer
import requests
url = "https://www150.statcan.gc.ca/t1/tbl1/en/tv.action?pid=3210001601"
page = requests.get(url)
data = page.text
soup = BeautifulSoup
soup.find_all('h1')
print(text)
Run Code Online (Sandbox Code Playgroud)
我不断收到错误:
AttributeError: 'str' object has no attribute 'descendants'
Run Code Online (Sandbox Code Playgroud)
老实说,我真的不知道这意味着什么,我能找到的唯一其他答案来自:AttributeError: 'str' object has no attribute 'descendants'我认为这不适用于我?
我在代码中做错了什么吗?(可能很多,但我的意思主要是为了这个错误)