UTF-8和HTML实体

Xim*_*mik 5 php utf-8

我尝试用PHP从Word .DOC文件中弹出文本.一切似乎都没问题,但唯一的麻烦就是这样

СУДОВА БУХГАЛТЕРІЯ
Run Code Online (Sandbox Code Playgroud)

而不是俄罗斯文本.我试过使用html_entity_decode和utf8_encode,但他们没有帮助.有没有简单的解决方案?

Gum*_*mbo 4

html_entity_decode应该使用正确的参数(除非您\xe2\x80\x99使用 PHP 5.3.3 或更高版本):

\n\n
html_entity_decode($str, ENT_QUOTES, \'UTF-8\')\n
Run Code Online (Sandbox Code Playgroud)\n\n

这会将字符引用转换为 UTF-8。在 PHP 5.3.3 之前,字符集参数\xe2\x80\x99s 默认值为ISO-8859-1。在这种情况下,无法转换西里尔字符,因为ISO 8859-1 字符集不包含它们。

\n