jTidy漂亮的打印自定义HTML标记

nan*_*doj 10 java jtidy angularjs

我正在尝试使用JTidy来打印由用户生成的格式良好的HTML:

<div class="component-holder ng-binding ng-scope ui-draggable ui-draggable-handle" data-component="cronos-datasource" id="cronos-datasource-817277">
    <datasource name="" entity="" key="" endpoint="" rows-per-page="">
        <i class="cpn cpn-datasource"></i>
    </datasource>
</div>
Run Code Online (Sandbox Code Playgroud)

这是我的配置:

Tidy tidy = new Tidy();
tidy.setXHTML(true);
tidy.setIndentContent(true);
tidy.setPrintBodyOnly(true);
tidy.setTidyMark(false);
tidy.setWraplen(2000);
tidy.setDropProprietaryAttributes(false);
tidy.setDropEmptyParas(false);
tidy.setTrimEmptyElements(false);
Run Code Online (Sandbox Code Playgroud)

但是jTidy正在删除我的AngularJS datasource指令.有没有办法解决这个问题?

我从日志中得到这个:

line 1 column 191 - Error: <datasource> is not recognized!
line 1 column 191 - Warning: discarding unexpected <datasource>
Run Code Online (Sandbox Code Playgroud)

删除tidy.setXHTML(true)或设置为false并添加tidy.setXmlTags(true)实际上解决了这个问题,它开始考虑用户定义的标签,但这不是一个好的解决方案,因为JTidy开始尝试关闭自封闭标签.

 <!-- this code -->
 <img src="anythig.jpg"/>
 <div id="anyid"></div> 

 <!-- will become -->
 <img src="anythig.jpg">
     <div id="anyid"></div>
 </img>
Run Code Online (Sandbox Code Playgroud)

我需要一个用于文本编辑器的格式化程序.我不能保证我们的用户将定义和使用哪些指令.它必须是适用于任何用户定义指令的通用解决方案

nan*_*doj 0

我通过对 JTidy 源代码进行一些更改解决了这个问题

https://github.com/nanndoj/jtidy

我添加了一个名为的新配置dropProprietaryTags

tidy.setDropProprietaryTags(false);
Run Code Online (Sandbox Code Playgroud)

现在它对我来说工作得很好。它true默认设置为,因此如果新属性未设置为,JTidy 可以以旧方式工作false