如何从Java中将子元素从XML提取到字符串?

phi*_*son 7 java xml

如果我有像这样的XML文档

<root>   
   <element1>
        <child attr1="blah">
           <child2>blahblah</child2>
        <child>   
   </element1> 
</root>
Run Code Online (Sandbox Code Playgroud)

我想获得带有第一个子元素的XML字符串.我的输出字符串是

<element1>
    <child attr1="blah">
       <child2>blahblah</child2>
    <child>
</element1>
Run Code Online (Sandbox Code Playgroud)

有很多方法,想看一些想法.我一直在尝试使用Java XML API,但目前尚不清楚是否有一种很好的方法可以做到这一点.

谢谢

Mat*_*inn 7

你是对的,使用标准的XML API,这不是一个好方法 - 这是一个例子(可能是错误的;它运行,但我很久以前写过它).

import javax.xml.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.*;
import javax.xml.transform.stream.*;
import org.w3c.dom.*;
import java.io.*;

public class Proc
{
    public static void main(String[] args) throws Exception
    {
        //Parse the input document
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document doc = builder.parse(new File("in.xml"));

        //Set up the transformer to write the output string
        TransformerFactory tFactory = TransformerFactory.newInstance();
        Transformer transformer = tFactory.newTransformer();
        transformer.setOutputProperty("indent", "yes");
        StringWriter sw = new StringWriter();
        StreamResult result = new StreamResult(sw);

        //Find the first child node - this could be done with xpath as well
        NodeList nl = doc.getDocumentElement().getChildNodes();
        DOMSource source = null;
        for(int x = 0;x < nl.getLength();x++)
        {
            Node e = nl.item(x);
            if(e instanceof Element)
            {
                source = new DOMSource(e);
                break;
            }
        }

        //Do the transformation and output
        transformer.transform(source, result);
        System.out.println(sw.toString());
    }
}
Run Code Online (Sandbox Code Playgroud)

看起来你可以通过使用doc.getDocumentElement().getFirstChild()来获得第一个孩子,但问题是如果root和child元素之间有任何空格,那么将创建一个Text节点.树,你将获得该节点而不是实际的元素节点.该程序的输出是:

D:\home\tmp\xml>java Proc
<?xml version="1.0" encoding="UTF-8"?>
<element1>
        <child attr1="blah">
           <child2>blahblah</child2>
       </child>
   </element1>
Run Code Online (Sandbox Code Playgroud)

如果你不需要它,我认为你可以压缩xml版本字符串,但我不确定.如果可能的话,我可能会尝试使用第三方XML库.


小智 5

由于这是谷歌的最佳答案,对于那些只想要基本的人:

    public static String serializeXml(Element element) throws Exception
{
    ByteArrayOutputStream buffer = new ByteArrayOutputStream();
    StreamResult result = new StreamResult(buffer);

    DOMSource source = new DOMSource(element);
    TransformerFactory.newInstance().newTransformer().transform(source, result);

    return new String(buffer.toByteArray());
}
Run Code Online (Sandbox Code Playgroud)

我用它来进行调试,这很可能是你需要的