我有几个单独的XML文件,包含TEI中的历史字母.现在我想将它们合并为一个文件,并以日期作为标准.
A1.xml
<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:id="1">
<teiHeader>
<title>Letter 1</title>
<date when="19990202" n="0"></date>
</teiHeader>
<text>
<p>Content of letter 1</p>
</text>
</TEI>
Run Code Online (Sandbox Code Playgroud)
和第二个文件,A2.xml:
<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:id="2">
<teiHeader>
<title>Letter 1</title>
<date when="20010202" n="0"></date>
</teiHeader>
<text>
<p>Content of letter 2</p>
</text>
</TEI>
Run Code Online (Sandbox Code Playgroud)
第三个,A3.xml:
<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:id="3">
<teiHeader>
<title>Letter 3</title>
<date when="18880101" n="0"></date>
</teiHeader>
<text>
<p>Content of letter 3</p>
</text>
</TEI>
Run Code Online (Sandbox Code Playgroud)
这些文件以连续文件名"A001.xml"到"A999.xml"命名,但不是按所需顺序命名.所以我的首选输出将是单个文件letters.xml:
<?xml version="1.0" encoding="UTF-8"?>
<CORRESPONDENCE>
<TEI xml:id="3">
<teiHeader>
<title>Letter 3</title>
<date when="18880101" n="0"></date>
</teiHeader>
<text>
<p>Content of letter 3</p> …Run Code Online (Sandbox Code Playgroud)