我希望连接到网站并下载一些 pdf 文件。该网站允许我们只有登录后才能查看内容。它要求我们使用OTP登录,并且不能同时在超过3台设备上登录。
我想下载列出的所有 pdf 文件。所以我之前尝试过
python playwright open --save-storage websitename.json
Run Code Online (Sandbox Code Playgroud)
保存登录信息。但它不适用于该特定网站。website.json 文件是空的,但它适用于其他网站。
因此,我能想到的唯一解决方案是连接到当前的浏览器,打开该网站,然后下载这些 pdf。
如果您对此有解决方案,甚至有其他方法,请告知。
我也在考虑转行做木偶师。但是,我不知道使用node.js解析html,因为我觉得使用css选择器更舒服,所以我无法切换它。