如何在java中将HTML转换为UTF-8

Lli*_*gra 9 html java utf-8

我有一个带有HTML实体的ASCII字符串,例如:

 à
 ¨
 ç
Run Code Online (Sandbox Code Playgroud)

我需要这个String没有那些实体并将它们转换为UTF-8字符.有没有简单的方法,在java中这样做?

哪里:

 Clazz.method("aà","UTF-8")
Run Code Online (Sandbox Code Playgroud)

返回"aà"

或类似的东西?

Ste*_*n C 17

看看org.apache.commons.lang.StringEscapeUtils.unescapeHtml(...).显然它理解HTML 4中定义的所有字符实体.