如何在PHP中解析HTML以进行缩小?

tim*_*ail 5 html php codeigniter html-parsing

我正在寻找一种算法来压缩我用PHP编写的CMS的HTML输出,用CodeIgniter框架编写.

我想试图任何尖括号之间除去空白,除 <script>,<pre>以及<style>元件和简单地忽略为了简化的那些元素.我应该澄清这是连续标签之间的空白,它们之间没有文字.

我应该如何解析HTML以找到我想要删除的空格?

编辑:要开始,我想删除不在<pre>标签中的所有制表符.这可以用正则表达式完成,我敢肯定,但有哪些替代方案?

Pet*_*ete 7

别.空白可以忽略不计.最好使用输出压缩,例如zlib此处

  • 这种努力并不能证明这种节约是合理的,而且它可能会在某些方面引起问题,例如戈登所提到的. (2认同)

Pet*_*ton 4

现有的 HTML 压缩解决方案有什么问题吗?

Minify处理HTML(以及 CSS 和 JS)。

(第二个链接指向源代码,其中注释了它所采取的步骤 - 如果您确实想创建自己的,这应该是一个很好的帮助 - 它是BSD 许可的。)

另外,正如Pete 所说,通过对 HTML(和 CSS/JS/等)使用 gzip 压缩,您将受益更多,并且不会被 Gordon 在他的评论中提到的问题所困扰。