在Word中将Word文档转换为可用的HTML

Ben*_*Ben 5 php ms-word

我有一组Word文档,我想使用我编写的PHP工具发布.我将Word文档复制并粘贴到文本框中,然后使用PHP程序将它们保存到MySQL中.我遇到的问题来自Word文档的所有非标准字符,如引号和省略号("...").我现在所做的是手动搜索并用纯文本或HTML实体替换这些东西(以及外部符号,如e-acute)(é等等)我是否可以调用PHP中的函数Word文档的输出,并将应该是实体的所有内容转换为实体,以及在Firefox中无法正确显示的其他符号转换为显示的符号.

谢谢!

eye*_*ess 5

这对我来说过去很好:

$str = mb_convert_encoding($str, 'HTML-ENTITIES', 'UTF-8')
Run Code Online (Sandbox Code Playgroud)


Ric*_*ner 4

更好的解决方案是确保您的数据库设置为支持 UTF-8 字符。扩展集中可用的附加字符应涵盖您正在讨论的所有“非标准”字符。

否则,如果您确实必须将这些字符转换为 HTML 实体,请使用htmlentities()