wop*_*low 5 javascript flash web-crawler node.js puppeteer
免责声明:我知道Flash将在2020年底被废弃,但是我不能放弃案件,需要在Puppeteer中安装Flash,尽管我也不喜欢。
我需要抓取某些Flash网站并对其进行截图,以进行以后的程序比较。我可以提供一个需要检查的有限域列表(尽管该列表可能会随时间变化,因此能够以某种方式在运行时加载它们非常好)。
经过一段时间的解决之后,我一直在Internet上进行搜索,最接近SA问题的是:如何将URL添加到puppeteer中的Flash白名单中
在使用puppeteer-extra-plugin-flash,提供路径和版本PepperFlash并运行Chrome可执行文件(而非Chromium)之后,我设法正确识别了Flash网站,但是我仍然需要单击灰色的拼图以允许Flash在任何网站上运行。
我只是找不到能在2019年7月使用的解决方案。
我尝试使用各种参数:
--ppapi-in-process ||
--disable-extensions-except=${pluginPath}/.. ||
--allow-outdated-plugins ||
--no-user-gesture-required
Run Code Online (Sandbox Code Playgroud)
还有更多,可能无关。对于其他人来说似乎最成功的方法似乎是使用PluginsAllowedForUrls并提供带有通配符的url列表,然后通过--user-data-dir- 加载预定义的配置文件-但我也没有走运(我想准备适当的配置文件时会遇到问题)。
我正在构建的此工具将不会公开,只有受过良好教育的团队才能在内部使用-因此,我不必担心太多的安全约束。我只需要在puppeteer中使用Flash。我也不需要关心对其进行Docker化。
我当前的设置简化了:
--ppapi-in-process ||
--disable-extensions-except=${pluginPath}/.. ||
--allow-outdated-plugins ||
--no-user-gesture-required
Run Code Online (Sandbox Code Playgroud)
Chrome version: 75.0.3770.100,
puppeteer-extra: 2.1.3
puppeteer-extra-plugin-flash: 2.13
谢谢您提供任何指导,有些工作示例很不错,在此先感谢您!
我设法做到了。我找到了较旧的Chrome版本(65),并使其与运行puppeteer-extra。
我使用并正在运行的库的版本:
PepperFlashPlugin版本: 32.0.0.223
谷歌浏览器: 65.0.3325.181
Puppeteer-core :(1.7.0如果您需要使用不同于65的版本,请检查相应版本的标签)
puppeteer-extra:2.1.3
puppeteer:1.0.0
puppeteer-extra-plugin-flash: 2.1.3
启动浏览器如下所示:
const browser = await PuppeteerExtra.launch({
headless: false,
executablePath: process.env.CHROME_EXECUTABLE,
args: [
'--window-size=800,600',
'--enable-webgl',
'--enable-accelerated-2d-canvas',
],
});
const page = await this.fBrowser.newPage();
await page.setViewport({ width: 800, height: 600});
await page.goto('http://ultrasounds.com', { waitUntil: 'networkidle2' });
Run Code Online (Sandbox Code Playgroud)
而且有效!