相关疑难解决方法(0)

如何在python中使用Selenium和Beautifulsoup解析网站？

编程新手并想出如何使用Selenium导航到我需要去的地方.我想现在解析数据,但不知道从哪里开始.有人能握住我的手一秒钟并指出我正确的方向吗？

任何帮助表示赞赏

python selenium beautifulsoup

39
推荐指数

2
解决办法

6万
查看次数

如何使用Mechanize处理JavaScript？

我正在连接到一个网站,登录.

该网站将我重定向到新页面,Mechanize处理所有cookie和重定向作业,但是,我无法获得最后一页.我使用Firebug并再次做同样的工作,看到还有两页我必须通过Mechanize传递.

我快速浏览了一下页面,看到有一些JavaScript和HTML代码,但无法理解,因为它看起来不像普通的页面代码.那些页面是什么？他们如何重定向到其他页面？我该怎么做才能通过这些？

html javascript ruby mechanize

27
推荐指数

3
解决办法

4万
查看次数

表格元素未显示在 BeautifulSoup 中

我正在尝试从此网站提取表数据

以下是代码——

import requests
from bs4 import BeautifulSoup as bs

page = requests.get('https://www.vitalityservicing.com/serviceapi/Monitoring/QueueDepth?tenantId=1')

soup = bs(page.text, "html.parser")

#None of the following method works
tb = soup.table 
#tb = soup.body.table
#tb = soup.find_all('table')

Run Code Online (Sandbox Code Playgroud)

当我尝试打印tb它时None

所以我尝试查看body下载的 HTML

print(soup.body.prettify())

Run Code Online (Sandbox Code Playgroud)

我没有看到table元素或其子元素。仅存在<body>和元素：<script>

但是当我检查 chrome 中的页面时，我看到了所有元素：

我不明白为什么当我在 chrome 上加载页面时该table元素没有被下载requests.get

html python beautifulsoup web-scraping python-requests

4
推荐指数

1
解决办法

4384
查看次数

标签统计

beautifulsoup ×2

html ×2

python-requests ×1

ruby ×1

web-scraping ×1