HTML编码逃避问题

Ric*_*ins 1 html encoding escaping

我正在做一个Android应用程序,我在其中查询web服务,获取一个JsonObject,并在获得所需的字符串后,我找到如下字符串:est& aacute;

我试过这两个:

StringEscapeUtils.escapeHTML4(text);
Run Code Online (Sandbox Code Playgroud)

结果是将& aacute转换为& amp; amp; amp; amp; amp; amp; amp; amp; amp;

Html.escapeHtml(test));
Run Code Online (Sandbox Code Playgroud)

什么也没做.

任何想法如何将其转化á为相应的角色?

Nat*_*ate 5

你声明你曾使用过以下内容:

StringEscapeUtils.escapeHTML4(text);
Run Code Online (Sandbox Code Playgroud)

而是试试这个:

StringEscapeUtils.unescapeHTML4(text);
Run Code Online (Sandbox Code Playgroud)

您正在重新编码HTML权利;

文档在这里:

https://commons.apache.org/proper/commons-lang/javadocs/api-release/org/apache/commons/lang3/StringEscapeUtils.html

// import commons http://commons.apache.org
import org.apache.commons.lang3.StringEscapeUtils;

public static String stripHtml(String str) {
 return StringEscapeUtils.unescapeHtml4(str.replaceAll("<[A-Za-z/].*?>", "")).trim();
}
Run Code Online (Sandbox Code Playgroud)

此外,您可以使用它来解码其他编码类型(JSON,XML等)或使用它进行编码.


这不是您要求的,但也可能对URL解码有用:

String result = URLDecoder.decode(url, "UTF-8");
Run Code Online (Sandbox Code Playgroud)

这里的API参考:

http://docs.oracle.com/javase/7/docs/api/java/net/URLDecoder.html