我尝试用PHP从Word .DOC文件中弹出文本.一切似乎都没问题,但唯一的麻烦就是这样
СУДОВА БУХГАЛТЕРІЯ
Run Code Online (Sandbox Code Playgroud)
而不是俄罗斯文本.我试过使用html_entity_decode和utf8_encode,但他们没有帮助.有没有简单的解决方案?
html_entity_decode
应该使用正确的参数(除非您\xe2\x80\x99使用 PHP 5.3.3 或更高版本):
html_entity_decode($str, ENT_QUOTES, \'UTF-8\')\n
Run Code Online (Sandbox Code Playgroud)\n\n这会将字符引用转换为 UTF-8。在 PHP 5.3.3 之前,字符集参数\xe2\x80\x99s 默认值为ISO-8859-1
。在这种情况下,无法转换西里尔字符,因为ISO 8859-1 字符集不包含它们。