StackExchange API的JSON URL返回乱码?

shs*_*mer 4 java url json stackexchange-api

我有一种感觉,我在这里做错了,但我不太确定我是否错过了一步,或者只是遇到了编码问题.这是我的代码:

URL url = new URL("http://api.stackoverflow.com/0.8/questions/2886661");

   BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));
   // Question q = new Gson().fromJson(in, Question.class);
   String line;
   StringBuffer content = new StringBuffer();
   while ((line = in.readLine()) != null)
   {
    content.append(line);
   }
Run Code Online (Sandbox Code Playgroud)

当我打印内容时,我得到了一大堆的翅膀和特殊的角色,基本上是乱七八糟的.我会在这里复制并通过它,但这不起作用.我究竟做错了什么?

Bkk*_*rad 5

在这种情况下,它不是字符编码问题,它是内容编码问题; 你期待文本,但服务器正在使用压缩来节省带宽.如果您在获取该URL时查看标题,则可以看到您要连接的服务器正在返回gzip压缩内容:

GET /0.8/questions/2886661 HTTP/1.1
Host: api.stackoverflow.com

HTTP/1.1 200 OK
Server: nginx
Date: Sat, 22 May 2010 15:51:34 GMT
Content-Type: application/json; charset=utf-8
<more headers>
Content-Encoding: gzip
<more headers>
Run Code Online (Sandbox Code Playgroud)

因此,您需要使用像Apache的HttpClient这样的更智能的客户端作为stevedbrown建议(尽管您需要通过调整来让它自动说出Gzip),或者显式解压缩您在示例代码中获得的流.请在您声明输入的行中尝试此操作:

 BufferedReader in = new BufferedReader(new InputStreamReader(new GZIPInputStream(url.openStream())));
Run Code Online (Sandbox Code Playgroud)

我已经确认这适用于你想要抓住的网址.