car*_*pii 15 php mysql unicode utf
我正在对一些混乱的数据进行一些数据清理,这些数据正被导入到mysql中.
数据包含'伪'unicode字符,它实际上作为'u00e9'等嵌入到字符串中.
所以一个字段可能是..'Jalostotitlu00e1n'我需要撕掉那个笨拙的'u00e1n'并用相应的utf字符替换它
我可以在mysql中使用substring和CHR执行此操作,但是我通过PHP预处理数据,所以我也可以在那里执行.
我已经知道如何配置mysql和php来处理utf数据.问题实际上只是在我导入的源数据中.
谢谢
小智 16
/*函数php将utf8 html转换为ansi*/
public static function Utf8_ansi($valor='') {
$utf8_ansi2 = array(
"\u00c0" =>"À",
"\u00c1" =>"Á",
"\u00c2" =>"Â",
"\u00c3" =>"Ã",
"\u00c4" =>"Ä",
"\u00c5" =>"Å",
"\u00c6" =>"Æ",
"\u00c7" =>"Ç",
"\u00c8" =>"È",
"\u00c9" =>"É",
"\u00ca" =>"Ê",
"\u00cb" =>"Ë",
"\u00cc" =>"Ì",
"\u00cd" =>"Í",
"\u00ce" =>"Î",
"\u00cf" =>"Ï",
"\u00d1" =>"Ñ",
"\u00d2" =>"Ò",
"\u00d3" =>"Ó",
"\u00d4" =>"Ô",
"\u00d5" =>"Õ",
"\u00d6" =>"Ö",
"\u00d8" =>"Ø",
"\u00d9" =>"Ù",
"\u00da" =>"Ú",
"\u00db" =>"Û",
"\u00dc" =>"Ü",
"\u00dd" =>"Ý",
"\u00df" =>"ß",
"\u00e0" =>"à",
"\u00e1" =>"á",
"\u00e2" =>"â",
"\u00e3" =>"ã",
"\u00e4" =>"ä",
"\u00e5" =>"å",
"\u00e6" =>"æ",
"\u00e7" =>"ç",
"\u00e8" =>"è",
"\u00e9" =>"é",
"\u00ea" =>"ê",
"\u00eb" =>"ë",
"\u00ec" =>"ì",
"\u00ed" =>"í",
"\u00ee" =>"î",
"\u00ef" =>"ï",
"\u00f0" =>"ð",
"\u00f1" =>"ñ",
"\u00f2" =>"ò",
"\u00f3" =>"ó",
"\u00f4" =>"ô",
"\u00f5" =>"õ",
"\u00f6" =>"ö",
"\u00f8" =>"ø",
"\u00f9" =>"ù",
"\u00fa" =>"ú",
"\u00fb" =>"û",
"\u00fc" =>"ü",
"\u00fd" =>"ý",
"\u00ff" =>"ÿ");
return strtr($valor, $utf8_ansi2);
}
Run Code Online (Sandbox Code Playgroud)
rab*_*dde 11
有一种方法.uXXXX
用他们的HTML表示替换all 并执行html_entity_decode()
即 echo html_entity_decode("Jalostotitlán");
表单中的每个UTF字符u1234
都可以用HTML格式打印ሴ
.但是进行替换非常困难,因为如果没有其他字符标识UTF序列的开头,可能会有很多误报.一个简单的正则表达式可能是
preg_replace('/u([\da-fA-F]{4})/', '&#x\1;', $str)
归档时间: |
|
查看次数: |
40235 次 |
最近记录: |