将 XML 转换为 CSV shell 命令行

Har*_*ode 5 command-line xml

我有一个大型 XML 文件 (600MB),我想通过终端命令将其转换为 CSV。我尝试使用以下语法通过 xml2 命令将 XML 转换为 TXT。

xml2 < BIG.xml > BIG.txt

我的 XML Fromat 是

<ReportDetails>
    <Date>08/08/2012</Date>
    <CaseNo>13030903</CaseNo>
    <UserDetailsText>Individual Details</UserDetailsText>
    <UserDetails>
        <UserId>0903</UserId>    
        <FirstName>John</FirstName>
        <Surname>Perry</Surname>
        <Occupation>Developer</Occupation>
        <DateofBirth>02/14/1981</DateofBirth>    
    </UserDetails>
    <ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
    <ApplicationDetails>
        <ApplicationNo>13033</ApplicationNo>
        <ApplicationName>John Perry</ApplicationName>
        <Department>Information Technology</Department>
        <ApplicationType>Personal</ApplicationType>
        <ApplicationDate>06/07/2012</ApplicationDate>
        <ApplicationEndDate>09/07/2012</ApplicationEndDate>
        <ApplicationStatus>Closed</ApplicationStatus>    
     </ApplicationDetails>  
</ReportDetails>
Run Code Online (Sandbox Code Playgroud)

我希望 CSV 文件中的这些字段用管道 (|) 分隔

日期 | 案例编号 | 名字 | 姓氏 | 申请编号 | 应用名称 | 申请日期 | 申请状态

另外,如果我想通过 PHP 文件来处理文件,我需要一个 shell 脚本来执行。

mic*_*ael 7

使用 XSL 执行转换为您需要的确切格式;例如,

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />

<xsl:template match="/ReportDetails">
  <xsl:value-of select="Date"/><xsl:text>|</xsl:text>
  <xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
  <xsl:apply-templates select="UserDetails" />
</xsl:template>

<xsl:template match="/ReportDetails/UserDetails">
  <xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
  <xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>

<!-- etc -->
</xsl:stylesheet>
Run Code Online (Sandbox Code Playgroud)

然后给出上面的(例如,在 foo.xsl 中转换原始 xml 文件 foo.xml):

$ xsltproc  foo.xsl  foo.xml 
08/08/2012|13030903|John|Perry|
Run Code Online (Sandbox Code Playgroud)

(问题在于 xsl 的细节……有很多方法可以实现这一点……)