Java删除空XML标记

Ray*_*ond 5 java xml tags

我正在寻找一个简单的Java代码段来从(任何)XML结构中删除空标记

<xml>
    <field1>bla</field1>
    <field2></field2>
    <field3/>
    <structure1>
       <field4>bla</field4>
       <field5></field5>
    </structure1>
</xml>
Run Code Online (Sandbox Code Playgroud)

应该变成;

<xml>
    <field1>bla</field1>
    <structure1>
       <field4>bla</field4>
    </structure1>
</xml>
Run Code Online (Sandbox Code Playgroud)

Chr*_*s R 8

这个XSLT样式表应该做你想要的:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:template match="@*|node()">
    <xsl:if test=". != '' or ./@* != ''">
      <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>
      </xsl:copy>
    </xsl:if>
  </xsl:template>
</xsl:stylesheet>
Run Code Online (Sandbox Code Playgroud)

它应该保留它们是空的,但具有不属性的元素.如果您不想要此行为,请更改:

<xsl:if test=". != '' or ./@* != ''">

至: <xsl:if test=". != ''">

如果你想知道如何在Java中应用XSLT,那么Interwebs上应该有很多教程.祝好运!


Jon*_*nik 7

我想知道用XOM库做这件事是否容易,并尝试了一下.

结果很简单:

import nu.xom.*;

import java.io.File;
import java.io.IOException;

public class RemoveEmptyTags {

    public static void main(String[] args) throws IOException, ParsingException {
        Document document = new Builder().build(new File("original.xml"));
        handleNode(document.getRootElement());
        System.out.println(document.toXML()); // empty elements now removed
    }

    private static void handleNode(Node node) {
        if (node.getChildCount() == 0 && "".equals(node.getValue())) {
            node.getParent().removeChild(node);
            return;
        }
        // recurse the children
        for (int i = 0; i < node.getChildCount(); i++) { 
            handleNode(node.getChild(i));
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

这可能无法正确处理所有角落情况,例如完全空的文档.如何处理空的但有属性的元素呢?

如果要使用属性保存XML标记,我们可以在方法'handleNode'中添加以下检查:

... && ((Element) node).getAttributeCount() == 0) )
Run Code Online (Sandbox Code Playgroud)

另外,如果xml有两个或多个空标签,一个接一个; 这种递归方法不会删除所有空标记!

(这个答案是我对XOM作为dom4j的潜在替代品的评估的一部分.)