相关疑难解决方法(0)

Java - 将命名的html实体转换为编号的xml实体

我正在寻找将包含html命名实体的html块转换为符合xml的块,该块使用编号的xml实体,同时保留所有html标记元素.

这是通过测试说明的基本思想:

@Test
public void testEvalHtmlEntitiesToXmlEntities() {
    String input = "<a href=\"test.html\">link&nbsp;</a>";
    String expected = "<a href=\"test.html\">link&#160;</a>";
    String actual = SomeUtil.eval(input);
    Assert.assertEquals(expected, actual);
}
Run Code Online (Sandbox Code Playgroud)

是否有人知道提供此功能的类?我可以编写一个正则表达式来迭代非元素匹配并执行:

xlmString += StringEscapeUtils.escapeXml(StringEscapeUtils.unescapeHtml(htmlString));
Run Code Online (Sandbox Code Playgroud)

但希望有一种更简单的方法或已经提供此类的课程.

html java xml parsing entities

7
推荐指数
1
解决办法
4845
查看次数

标签 统计

entities ×1

html ×1

java ×1

parsing ×1

xml ×1