在C#中使用未关闭的标记读取XML

Ben*_*min 4 c# xml-parsing

我有一个程序,它运行测试并生成一个包含所有结果的网格视图,以及一个XML日志文件.该程序还具有加载日志以复制网格视图的功能.

由于程序在执行时写入日志文件,如果崩溃,日志文件将缺少结束标记.我仍然希望能够加载这些XML文件,因为仍然有很多有价值的数据可以帮助我找出导致崩溃的原因.

我想可能会浏览XML文件并关闭任何未关闭的XML标记,或者编写某种"Dirty"XML读取器,假装每个标记都已关闭.关于我能做什么或如何进行的任何想法?

编辑:

<Root>
  <Parent>
     <Child Name="One">
        <Foo>...</Foo>
        <Bar>...</Bar>
        <Baz>...</Baz>
     </Child>
     <Child Name="Two">
        <Foo>...</Foo>
        <Bar>...</Bar>
 !-- Crash happens here --!
Run Code Online (Sandbox Code Playgroud)

从此我仍然希望生产

 Child   Foo   Bar   Baz
 One     ...   ...   ...
 Two     ...   ...    /
Run Code Online (Sandbox Code Playgroud)

Jon*_*eet 5

据推测它是有效的,直到它被截断...所以使用XmlReader可以工作...只是准备好处理它到达截断点时爆炸.

现在XmlReaderAPI不是非常令人愉快(IMO)所以你可能想要转移到一些有趣数据的开头(这本身就必须完整),然后调用XNode.ReadFrom(XmlReader)方法以简单易用的方式获取数据形成.然后移动到下一个元素的开头并执行相同的操作,等等.

示例代码:

using System;
using System.Linq;
using System.Xml;
using System.Xml.Linq;

class Program
{
    static void Main(string[] args)
    {
        using (XmlReader reader = XmlReader.Create("test.xml"))
        {
            while (true)
            {
                while (reader.NodeType != XmlNodeType.Element ||
                    reader.LocalName != "Child")
                {
                    if (!reader.Read())
                    {
                        Console.WriteLine("Finished!");
                    }
                }
                XElement element = (XElement) XNode.ReadFrom(reader);
                Console.WriteLine("Got child: {0}", element.Value);
            }
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

示例XML:

<Root>
  <Parent>
    <Child>First child</Child>
    <Child>Second child</Child>
    <Child>Broken
Run Code Online (Sandbox Code Playgroud)

样本输出:

有孩子:第一个孩子有孩子:第二个孩子

Unhandled Exception: System.Xml.XmlException: Unexpected end of file has occurred
The following elements are not closed: Child, Parent, Root. Line 5, position 18.
   at System.Xml.XmlTextReaderImpl.Throw(String res, String arg)
   at System.Xml.XmlTextReaderImpl.ParseElementContent()
   at System.Xml.Linq.XContainer.ReadContentFrom(XmlReader r)
   at System.Xml.Linq.XContainer.ReadContentFrom(XmlReader r, LoadOptions o)
   at System.Xml.Linq.XElement.ReadElementFrom(XmlReader r, LoadOptions o)
   at System.Xml.Linq.XNode.ReadFrom(XmlReader reader)
   at Program.Main(String[] args)
Run Code Online (Sandbox Code Playgroud)

显然你想要捕获异常,但你可以看到它设法正确读取前两个元素.