目前我正在努力在java中转换具有等效字符的HTML代码.我需要将以下代码转换为字符.
è - è
® - ®
& - &
ñ - ñ
& - &
Run Code Online (Sandbox Code Playgroud)
我尝试使用正则表达式模式
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Run Code Online (Sandbox Code Playgroud)
当我调试时,matcher.find()给我true但控件跳过我编写转换代码的循环.不知道那里发生了什么.
另外,有没有办法优化这个正则表达式?
任何帮助表示赞赏.
例外
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
Run Code Online (Sandbox Code Playgroud)