Python,XML AttributeError:“ NodeList”对象没有属性“ firstChild”

Gil*_*t V 5 python xml xml-parsing

您好,我使用的xml文件有问题。现在发生的事情是,每当我尝试获取msg标记时,都会收到一个错误,阻止我访问数据。这是到目前为止我正在编写的代码。

from xml.dom import minidom
import smtplib
from email.mime.text import MIMEText
from datetime import datetime

def xml_data ():

  f = open('C:\opidea_2.xml', 'r')

  data = f.read()

  f.close()

  dom = minidom.parseString(data)

  ic = (dom.getElementsByTagName('logentry'))

  dom = None      
  content = ''  
  for num in ic:

    xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue

    content += xmlDate + '\n '

    xmlMsg = num.getElementsByTagName('msg')


    if xmlMsg !='' and len(xmlMsg) > 0:
        xmlMsgc = xmlMsg[0].firstChild.nodeValue
        content += "   Comments: \n        " + str(xmlMsg) + '\n\n'

    else:
        xmlMsgc = "No comment made."

        content += xmlMsgc

  print content

if __name__ == "__main__":
xml_data ()
Run Code Online (Sandbox Code Playgroud)

如果有帮助,这是xml的一部分。

 <log>
 <logentry
  revision="33185">
 <author>glv</author>
 <date>2012-08-06T21:01:52.494219Z</date>
 <paths>

 <path
  kind="file"
  action="M">/branches/Patch_4_2_0_Branch/text.xml</path>   

 <path
  kind="dir"
  action="M">/branches/Patch_4_2_0_Branch</path>

</paths>
<msg>PATCH_BRANCH:N/A
 BUG_NUMBER:N/A
 FEATURE_AFFECTED:N/A
 OVERVIEW:N/A
  Adding the SVN log size requirement to the branch 
 </msg>
  </logentry>
    </log>
Run Code Online (Sandbox Code Playgroud)

现在,当我使用时,xmlMsg = num.getElementsByTagName('msg')[0].toxml()我可以使代码正常工作,我只需要做很多替换,而不必这样做。我也有使用日期工作xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue

有什么我想念的或做错的吗?同样是回溯。

Traceback (most recent call last):
  File "C:\python\src\SVN_Email_copy.py", line 141, in <module>
    xml_data ()
  File "C:python\src\SVN_Email_copy.py", line 94, in xml_data
    xmlMsg = num.getElementsByTagName('msg').firstChild.nodeValue
AttributeError: 'NodeList' object has no attribute 'firstChild'
Run Code Online (Sandbox Code Playgroud)

mzj*_*zjn 5

我建议采用不同的方法。下面是一个可以做你想做的事情的程序(我认为......)。它使用ElementTree API而不是 minidom。这大大简化了事情。

您已经发布了几个有关使用 minidom 解析 XML 文件的相关问题。我真的认为您应该研究 ElementTree (对于更高级的东西,请查看 ElementTree 的“超集”,lxml)。这两个 API 都比 minidom 更容易使用。

import xml.etree.ElementTree as ET

def xml_data():
    root = ET.parse("opidea_2.xml")
    logentries = root.findall("logentry")
    content = ""

    for logentry in logentries:
        date = logentry.find("date").text
        content += date + '\n '
        msg = logentry.find("msg")
        if msg is not None:
            content += "   Comments: \n        " + msg.text + '\n\n'
        else:
            content += "No comment made."

    print content

if __name__ == "__main__":
    xml_data()
Run Code Online (Sandbox Code Playgroud)

使用您的 XML 示例时的输出(您可能希望在确切布局上做更多工作):

2012-08-06T21:01:52.494219Z
    Comments: 
        PATCH_BRANCH:N/A
 BUG_NUMBER:N/A
 FEATURE_AFFECTED:N/A
 OVERVIEW:N/A
  Adding the SVN log size requirement to the branch 
Run Code Online (Sandbox Code Playgroud)