我正在研究一种网络爬虫,它可以从世界各地的网站上获取数据,并且正在处理不同的语言和编码.
目前我正在使用以下功能,它在99%的情况下都有效.但是有1%令我头疼.
function convertEncoding($str) { return iconv(mb_detect_encoding($str), "UTF-8", $str); }
php encoding utf-8
encoding ×1
php ×1
utf-8 ×1