表格元素未显示在 BeautifulSoup 中

spa*_*ark 4 html python beautifulsoup web-scraping python-requests

我正在尝试从此网站提取表数据

以下是代码——

import requests
from bs4 import BeautifulSoup as bs

page = requests.get('https://www.vitalityservicing.com/serviceapi/Monitoring/QueueDepth?tenantId=1')

soup = bs(page.text, "html.parser")

#None of the following method works
tb = soup.table 
#tb = soup.body.table
#tb = soup.find_all('table')

Run Code Online (Sandbox Code Playgroud)

当我尝试打印tb它时None

所以我尝试查看body下载的 HTML

print(soup.body.prettify())

Run Code Online (Sandbox Code Playgroud)

我没有看到table元素或其子元素。仅存在<body>和元素：<script>

但是当我检查 chrome 中的页面时，我看到了所有元素：

我不明白为什么当我在 chrome 上加载页面时该table元素没有被下载requests.get

您没有获得该内容，因为当您执行请求时，该内容不存在于页面中。然而。

如果您检查脚本标记之间的 JavaScript 代码，您可以看到它正在动态生成表格。因此，您会在此之前收到 html 代码，因为它requests不是浏览器，不会执行 js，并且您看不到该表。

现在您知道为什么看不到表格了，您的下一个问题是如何在 javascript 执行后生成 HTML。别晕，这是可行的。您可能会发现这个问题的解决方案很有趣。

祝你好运

归档时间：	7 年，3 月前
查看次数：	4384 次
最近记录：	7 年，3 月前

如何使用Python检索动态html内容的值 7

美丽的汤找不到标签 6

更多相关链接

如何防止IFRAME重定向顶级窗口 123

以高质量在python中保存图像 95

列表中的值大于某个数字的数量 57

使用boto3完全扫描dynamoDb 48

#符号的HTML字符实体是什么？ 47

个人数据自动填写浏览器使用的表单字段名称(Safari,Opera) 40

如何使输入字段输入数字和密码？ 20

Beautifulsoup4与lxml对比Beautifulsoup3 5

当带有 extract() 的 Scrapy 选择器返回 None 时如何设置默认值？ 3

BeautifulSoup 无法在 google colab 中工作 1

"px","dip","dp"和"sp"之间有什么区别？ 5676

RESTful编程究竟是什么？ 3917

如何删除远程标签？ 3121

将字节转换为字符串？ 1968

如何"git克隆"包括子模块？ 1864

在Chrome中停用相同的来源政策 1443

如何为项目中的单个文件禁用ARC？ 1332

Android Studio中的Gradle是什么？ 1257

如何在Bash中将字符串转换为小写？ 1158

返回IEnumerable <T>与IQueryable <T> 1051