下载网页中的所有 PDF 链接?

iAs*_*Ask 27 windows-7 pdf download download-manager

你知道一个下载网页中所有PDF链接的好软件吗??

操作系统为 Windows 7。

Kev*_*ton 38

您可以使用wget并运行如下命令:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com
Run Code Online (Sandbox Code Playgroud)

或者使用简短的选项:

wget -r -l 1 -nd -nH -A pdf http://example.com
Run Code Online (Sandbox Code Playgroud)

更新:由于您的更新表明您正在运行 Windows 7:从提示中使用wget for Windowscmd

更新 2:对于图形解决方案 - 虽然它可能有点矫枉过正,因为它也获取其他文件是DownThemAll

  • 这甚至拒绝初始 .html 页面。它曾经被测试过吗? (2认同)

Lor*_*uer 10

  1. 在浏览器中,按CTRL+ SHIFT+ J,然后输入

    var pdflinks =[]; Array.prototype.map。call(document.querySelectorAll("a[href$=\".pdf\"]"), function(e, i){if((pdflinks||[]).indexOf(e.href)==-1) { pdflinks.push( e.href);} }); console.log(pdflinks.join(" "));

    这将在控制台中返回:

    " https://superuser.com/questions/tagged/somepdf1.pdf " " https://superuser.com/questions/tagged/somepdf2.pdf " " https://superuser.com/questions/tagged/somepdf3.pdf

  2. 现在wget与命令行选项一起使用wget url1 url2 ...

复制并粘贴此内容,打开控制台回车,wget按鼠标右键插入剪贴板内容,然后按回车。

要使用下载文件,请使用“\n”连接行并使用如下参数 wget -i mydownload.txt

请注意,大多数其他 (GUI) 下载程序也接受使用空格分隔的 URL 列表调用。

希望这可以帮助。我一般都是这样做的。它比任何带有图形 UI 的扩展都更快、更灵活,我必须学习并保持熟悉。