带有混乱编码的$ _GET变量

lis*_*aro 4 php encoding

我在我的网站上编码很麻烦.

这是我现在的问题,如果我去analize.php?dialog=árbol哪个代码是:

<?
echo $_GET['dialog'];
echo "sabía";
Run Code Online (Sandbox Code Playgroud)

我得到:

sabía
sabía
Run Code Online (Sandbox Code Playgroud)

我正在使用ANSI,改为UTF-8打破两者.我不明白为什么会发生这种情况,而且上面没有任何代码.我不关心它们如何显示,因为该文件仅用于从我的数据库中获取数据.但我需要$_GET正确显示,以便将其包含在查询中.

如何才能做到这一点?

dec*_*eze 5

您不能在URL中发送字符"í",URL必须使用ASCII字符集的子集.因此,URL ?dialog=sab%C3%ADa在被发送到服务器之前由您的浏览器进行编码.%C3%AD表示两个字节C3 AD,即字符"í"的UTF-8编码.您可以通过以下方式确认var_dump($_SERVER['QUERY_STRING']);.这由PHP自动解码,结果是"sabía"的UTF-8字节序列,其中"í"使用两个字节进行编码C3 AD.

您的浏览器使用Windows-1252或ISO-8859-1字符集解释此字节序列.该字节C3在此编码中表示"Ã",该字节AD表示软连字符且不可见.

两种可能的解决方

  1. 到处使用UTF-8(推荐!)

  2. $_GET使用mb_convert_encodingiconv(不推荐)将值转换为Windows-1252/ISO-8859-1(或您要在您的网站上使用的任何编码)

    • 即使在这种情况下,您也应该设置一个标题,向浏览器宣告您正在使用的编码

简而言之,您需要确保在任何地方使用相同的编码,并向浏览器指定具体的编码.