joh*_*Art 3 php character-encoding cjk
好吧,我放弃了.我一直在搞乱所有我能想到的从目标网站检索数据,该网站有中文繁体编码信息(charset = GB2312).
我一直在使用simple_html_parser,但它似乎没有返回中文字符,事实上我得到的是一些嵌入菱形形状的怪异问号.(" ѯ ؼ ֣ "喜欢这样)
声明php文件的编码除了删除页面开头显示的一些不需要的字符外没有做任何事情.
通过声明我的意思是:
header('Content-Type', 'text/html; charset=GB2312');
Run Code Online (Sandbox Code Playgroud)
我不能得到任何用中文写的数据,也试过file_get_contents同样的运气.我可能遗漏了一些明显的东西,因为我在其他地方找不到任何相关的讨论.
提前致谢.
您是否尝试使用mb_convert_encoding或iconv转换编码,例如
$str = mb_convert_encoding($content, 'UTF-8', 'GB2312');
Run Code Online (Sandbox Code Playgroud)
要么
$str = iconv("UTF-8", "GB2312//IGNORE", $content);
Run Code Online (Sandbox Code Playgroud)