我正在寻找将包含html命名实体的html块转换为符合xml的块,该块使用编号的xml实体,同时保留所有html标记元素.
这是通过测试说明的基本思想:
@Test
public void testEvalHtmlEntitiesToXmlEntities() {
String input = "<a href=\"test.html\">link </a>";
String expected = "<a href=\"test.html\">link </a>";
String actual = SomeUtil.eval(input);
Assert.assertEquals(expected, actual);
}
Run Code Online (Sandbox Code Playgroud)
是否有人知道提供此功能的类?我可以编写一个正则表达式来迭代非元素匹配并执行:
xlmString += StringEscapeUtils.escapeXml(StringEscapeUtils.unescapeHtml(htmlString));
Run Code Online (Sandbox Code Playgroud)
但希望有一种更简单的方法或已经提供此类的课程.