Java库可以逃避/清理XML吗?

jua*_*cks 2 html java xml tags escaping

我得到一些格式错误的xml文本输入,如:

"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
Run Code Online (Sandbox Code Playgroud)

我想清理输入以获得:

"<Tag>something</Tag> 8 &gt; 3, 2 &lt; 3, ... <Tag>something</Tag>"
Run Code Online (Sandbox Code Playgroud)

也就是说,逃避那些像<,>这样的特殊符号然后保留有效标签(" <Tag>something</Tag>,注意,具有相同的情况)

你知道有没有java库吗?可能是一个xml/html解析器?(虽然我真的不需要解析器,简单的"干净"程序)

Pab*_*afi 6

JTidy是"HTML语法检查器和漂亮的打印机.就像它的非Java表兄弟一样,JTidy可以用作清理格式错误和错误的HTML的工具"

但它也可以与xml一起使用.查看文档.它非常聪明,它可能适合你.