我正在尝试使用 BeautifulSoup 抓取 coinmarketcap.com (我知道有一个 API,出于培训目的,我想使用 BeautifulSoup)。到目前为止爬取的每一条信息都非常容易选择,但现在我喜欢让“持有者统计信息”看起来像这样:
我用于选择包含所需信息的特定 div 的测试代码如下所示:
import requests
from bs4 import BeautifulSoup
url = 'https://coinmarketcap.com/currencies/bitcoin/holders/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
holders = soup.select('div', class_='n0m7sa-0 kkBhMM')
print(holders)
Run Code Online (Sandbox Code Playgroud)
print(holders)的输出不是 div 的预期内容,而是网站的整个 html 内容。我附加了一张图片,因为输出代码太长。
有谁知道,为什么会这样?