Joh*_*ler 8 html web-crawler static-site
我需要找到一种方法来抓取我们公司的一个Web应用程序,并从中创建一个静态站点,可以刻录到CD并由旅行销售人员用来演示网站.后端数据存储分布在许多系统中,因此只需在销售人员的笔记本电脑上的VM上运行该站点就行不通.在一些客户端(没有互联网,手机......原始,我知道)他们将无法访问互联网.
有没有人对爬行器有任何好的建议,可以处理链接清理,闪存,一点ajax,CSS等等?我知道赔率很小,但在我开始编写自己的工具之前,我想我会把问题抛到这里.
wpr*_*prl 13
通过使用WebCrawler,例如以下之一:
仅仅因为没有人复制粘贴一个工作命令......我正在尝试......十年后。:D
wget --mirror --convert-links --adjust-extension --page-requisites \
--no-parent http://example.org
Run Code Online (Sandbox Code Playgroud)
它对我来说就像一种魅力。
wget 或curl 都可以递归地跟踪链接并镜像整个站点,因此这可能是一个不错的选择。不过,您将无法使用网站的真正交互式部分,例如搜索引擎或任何修改数据的内容。
是否有可能创建可以从销售人员的笔记本电脑上运行且应用程序可以与之交互的虚拟后端服务?
| 归档时间: |
|
| 查看次数: |
4439 次 |
| 最近记录: |