Dou*_*aye 8 php caching render static-html web-scraping
我们正在关闭Conversations Network(包括IT Conversations播客).计划是在Internet Archive上呈现我们网站的静态HTML版本,以便永久托管.
从目前从PHP动态生成的大约5,000个动态页面生成静态HTML的最简单方法是什么?
我知道我们可以调整代码来缓存PHP输出,将其写入文件,然后遍历站点地图以生成每个页面.但我想知道是否有任何我们应该考虑的选择.用于执行此操作并按原样刮取HTML的任何工具?(Acrobat Pro以外的其他东西?)
不幸的是,我们也有相当数量的Ajax调用,这将使这更加困难.我想我们必须首先取消Ajax.
有一个很棒的软件叫做“ Teleport Pro ”(不幸的是付费软件),它可以创建网站的可浏览/重复副本。一旦上传到服务器,其工作方式应该与原始站点完全相同。
当您从动态页面创建静态 html 时,需要记住的事情是:
但“Teleport pro”是一个真正可靠的程序,已经存在相当长一段时间了。我过去曾使用过它,并且可能会再次使用它。
另一种方法可能是 php 模块“php-apc”,它创建一个缓存。在这种情况下,您需要在创建完整的缓存之前抓取整个站点。我不太熟悉它,但安装很容易完成,你可以看看生成的文件是否有任何用处。
| 归档时间: |
|
| 查看次数: |
3076 次 |
| 最近记录: |