使用PHP删除MS Word"HTML"

a c*_*der 5 html php ms-word htmlcleaner

可能重复:
清理Word HTML的最佳免费方法是什么?
PHP来清理粘贴的Microsoft输入

我允许客户端在富文本编辑器中输入注释,并且最近才升级到ckEditor 3x,默认情况下会删除MS字类,样式和注释(当用户粘贴到编辑器对象中时).所以前进我已经准备好了.

我最近需要清理5年的笔记,其中一些笔记有MS word生成的HTML.我需要遍历这个文本正文并清理它.

我不需要删除所有span标记,只需要删除那些由Microsoft编写的标记.

我尝试过使用HTMLCleaner,但它并没有删除MS生成的HTML. http://word2cleanhtml.com完全符合我的要求,但开发人员目前不提供公共使用的API(截至2012年7月9日).

在过去的几周里,我一直在寻找这样一堂课,而且运气不好.你有没有找到一个你想分享的有用课程?

max*_*hud 7

http://htmlpurifier.org/

这将做你想要的.