相关疑难解决方法(0)

使用Selenium,Chrome和Python下载PDF

我尝试关注有关该主题的先前帖子(例如post 1post 2),但是我仍然很困惑。

我的脚本必须使用一组凭据登录到站点,然后在某些下拉菜单中导航以选择报告。选择报告后,将弹出一个新窗口,必须在其中调整参数以生成报告。设置完参数后,相同的弹出窗口将以生成的PDF格式刷新报告,并使用Chrome的内置PDF查看器显示。我的印象是,将某些选项传递给webdriver会禁用此PDF查看器,而只是下载文件,但是PDF查看器仍在显示,不会自动下载任何内容。我当然会丢失某些东西,或者我写的东西不正确。这是我的代码的要旨:

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_experimental_option('prefs',  {
    "download.default_directory": download_dir,
    "download.prompt_for_download": False,
    "download.directory_upgrade": True,
    "plugins.plugins_disabled": ["Chrome PDF Viewer"]
    }
)

browser = webdriver.Chrome(options = chrome_options)

driver = webdriver.Chrome()
driver.get(url)

#In between here are a bunch of steps here that navigates through drop down menus

#This step may not be necessary, but I figured I'd include it to address when the pop up window …
Run Code Online (Sandbox Code Playgroud)

python selenium selenium-chromedriver

10
推荐指数
1
解决办法
4769
查看次数

Python 下载嵌入在页面中的 PDF

我有这个链接:

我想下载嵌入的 PDF。

我已经尝试了urllib和的正常方法,request但它们不起作用。

import urllib2

url = "http://www.equibase.com/premium/chartEmb.cfm?track=ALB&raceDate=06/17/2002&cy=USA&rn=1"
response = urllib2.urlopen(url)
file = open("document.pdf", 'wb')
file.write(response.read())
file.close()
Run Code Online (Sandbox Code Playgroud)

此外,我也试图找到pdf的原始链接,但也没有用。

内部链接:

python pdf web-scraping

3
推荐指数
1
解决办法
6999
查看次数