无法从Wiki阅读日语内容

Question

无法从Wiki阅读日语内容

new*_*and 3 java encoding parsing mediawiki

我试图使用下面的代码从Wiki中读取日语内容

ClientConfig clientConfig = new DefaultClientConfig();
client = Client.create(clientConfig);
WebResource webResource = client.resource("http://ja.wikipedia.org/w/api.php?format=json&action=query&titles=AKB48&rvprop=content&prop=revisions");
String s  = webResource.get(String.class);          
System.out.println(s);

Run Code Online (Sandbox Code Playgroud)

结果就像

{"query":{"pages":{"2276803":{"pageid":2276803,"ns":0,"title":"AKB48","revisions":[{"contentformat":"text/x-wiki","contentmodel":"wikitext","*":"{{Otheruseslist|\u65e5\u672c\u306e\u5973\u6027\u30a2\u30a4\u30c9\u30eb\u30b0\u30eb\u30fc\u30d7....

Run Code Online (Sandbox Code Playgroud)

它显示\ uxxx而不是真正的日语单词.我知道它必须是编码问题.但我仍然无法使它成功.

任何帮助将非常感激.

Answer 1

Jon*_*eet 5

这看起来对我来说是完全合理的JSON.与Java一样,JSON使用\u转义序列来表示字符.我认为这根本不是编码问题.

我建议您找到一个带有您喜欢的API的JSON解析器,将该字符串插入其中,然后您就可以获取"未转义"值.

归档时间：	12 年，10 月前
查看次数：	96 次
最近记录：	12 年，10 月前