麻烦用.Net http处理程序编码au umlaut

dla*_*lin 5 javascript asp.net diacritics character-encoding encodeuricomponent

我有一个JavaScript请求转到ASP.Net(2.0)HTTP处理程序,它将请求传递给java Web服务.在此系统中,特殊字符(例如具有重音的字符)无法正确传递.

例如

  • 人力投入: Düsseldorf
  • 成为JavaScript asynch请求http://site/serviceproxy.ashx?q=D%FCsseldorf,据我所知,它在ISO-8859-1和UTF-8中都有效.(除非它是UTF-8中的%c3%bc)
  • HttpContext.Current.Request.QueryString.Get("q")返回D?sseldorf故障开始的地方.
  • 但是HttpUtility.UrlEncode(HttpContext.Current.Request.QueryString.Get("q"), Encoding.GetEncoding("ISO-8859-1"))返回D%3fsseldorf('''')
  • HttpUtility.UrlEncode(HttpContext.Current.Request.QueryString.Get("q"), Encoding.UTF8)返回D%ef%bfsseldorf

因此,该值不会被解码,也不会被正确地重新编码以传递给java服务.

  • 注意HttpContext.Current.Request.Url.Query?q=D%FCsseldorf&output=json&from=1&to=10
  • 虽然HttpContext.Current.Request.QueryString.ToString()q=D%ufffdsseldorf&output=json&from=1&to=10

为什么这样,我怎么能告诉它HttpContext尊重请求标题,包括:

Content-Type=application/x-www-form-urlencoded;+charset=UTF-8
Run Code Online (Sandbox Code Playgroud)

QueryString使用UTF-8字符集解码URL .

附录:正如答案所指出的那样,问题不在于解码与编码有关; escape()在JavaScript中使用不会根据UTF-8进行转义,而使用时encodeURIComponent()也是如此.

eri*_*son 6

我不知道您的服务器(IIS?)使用的默认字符编码是什么,或者是否可以更改,但我可以告诉您一些可能有用的信息.

0xFC是ü的ISO-8859-1编码.虽然Unicode代码点是U + 00FC,但当使用UTF-8编码时,这需要两个字节,并且变为0xC3 0xBC.

如果UTF-8解码器要查看非法字节序列0xFC,它会将其解码为Unicode"替换字符",U + FFFD,并在它看到另一个有效字节序列的开头时拾取,在本例中为".

你得到的原因%3f是'?' 是拉丁字符集的"替换字符",类似于Unicode字符集中的 .

我相信您所看到的是使用ISO-8859-1的客户端编码,但服务器使用UTF-8进行解码.一旦它到达服务器,您的数据就会被破坏.我建议您修改客户端以使用UTF-8编码; 它应该是请求http://site/serviceproxy.ashx?q=D%C3%BCsseldorf

听起来您正在使用JavaScript构建这些URL,因此您应该使用encodeURIencodeURIComponent函数,而不是escape.