HTML中的HTML净化

Asc*_*con 6 html javascript php

我正在编写PHP类,必须potentially dangerous elements or bogus html tag (such as bad links)从HTML源中删除所有.

通常我会使用HTML Purifier library或类似的库,
但在这个项目中需要自编代码.

有两个条件:

  1. 它不能超过3kB代码
  2. 它应该执行得非常快

我写了一些可以完成这项工作的东西:http://pihost.pl/purify.php
但我不知道它是否足够安全使用

我的问题是:
有没有办法正确测试?
或者也许有人拥有这样快速,小巧且经过测试的图书馆?

Viv*_*ath 1

需要考虑的一个重要问题是——您的净化器对损坏/格式错误的 HTML 有何反应?为了解决这种情况,我建议先通过PHP tidy运行它来清理 HTML,然后再净化它。

如果您想要一系列测试,可以尝试查看HTMLPurifier 使用的测试。