new*_*and 3 java encoding parsing mediawiki
我试图使用下面的代码从Wiki中读取日语内容
ClientConfig clientConfig = new DefaultClientConfig();
client = Client.create(clientConfig);
WebResource webResource = client.resource("http://ja.wikipedia.org/w/api.php?format=json&action=query&titles=AKB48&rvprop=content&prop=revisions");
String s = webResource.get(String.class);
System.out.println(s);
Run Code Online (Sandbox Code Playgroud)
结果就像
{"query":{"pages":{"2276803":{"pageid":2276803,"ns":0,"title":"AKB48","revisions":[{"contentformat":"text/x-wiki","contentmodel":"wikitext","*":"{{Otheruseslist|\u65e5\u672c\u306e\u5973\u6027\u30a2\u30a4\u30c9\u30eb\u30b0\u30eb\u30fc\u30d7....
Run Code Online (Sandbox Code Playgroud)
它显示\ uxxx而不是真正的日语单词.我知道它必须是编码问题.但我仍然无法使它成功.
任何帮助将非常感激.
这看起来对我来说是完全合理的JSON.与Java一样,JSON使用\u转义序列来表示字符.我认为这根本不是编码问题.
我建议您找到一个带有您喜欢的API的JSON解析器,将该字符串插入其中,然后您就可以获取"未转义"值.
| 归档时间: |
|
| 查看次数: |
96 次 |
| 最近记录: |