Gil*_*t V 5 python xml xml-parsing
您好,我使用的xml文件有问题。现在发生的事情是,每当我尝试获取msg标记时,都会收到一个错误,阻止我访问数据。这是到目前为止我正在编写的代码。
from xml.dom import minidom
import smtplib
from email.mime.text import MIMEText
from datetime import datetime
def xml_data ():
f = open('C:\opidea_2.xml', 'r')
data = f.read()
f.close()
dom = minidom.parseString(data)
ic = (dom.getElementsByTagName('logentry'))
dom = None
content = ''
for num in ic:
xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue
content += xmlDate + '\n '
xmlMsg = num.getElementsByTagName('msg')
if xmlMsg !='' and len(xmlMsg) > 0:
xmlMsgc = xmlMsg[0].firstChild.nodeValue
content += " Comments: \n " + str(xmlMsg) + '\n\n'
else:
xmlMsgc = "No comment made."
content += xmlMsgc
print content
if __name__ == "__main__":
xml_data ()
Run Code Online (Sandbox Code Playgroud)
如果有帮助,这是xml的一部分。
<log>
<logentry
revision="33185">
<author>glv</author>
<date>2012-08-06T21:01:52.494219Z</date>
<paths>
<path
kind="file"
action="M">/branches/Patch_4_2_0_Branch/text.xml</path>
<path
kind="dir"
action="M">/branches/Patch_4_2_0_Branch</path>
</paths>
<msg>PATCH_BRANCH:N/A
BUG_NUMBER:N/A
FEATURE_AFFECTED:N/A
OVERVIEW:N/A
Adding the SVN log size requirement to the branch
</msg>
</logentry>
</log>
Run Code Online (Sandbox Code Playgroud)
现在,当我使用时,xmlMsg = num.getElementsByTagName('msg')[0].toxml()
我可以使代码正常工作,我只需要做很多替换,而不必这样做。我也有使用日期工作xmlDate = num.getElementsByTagName('date')[0].firstChild.nodeValue
。
有什么我想念的或做错的吗?同样是回溯。
Traceback (most recent call last):
File "C:\python\src\SVN_Email_copy.py", line 141, in <module>
xml_data ()
File "C:python\src\SVN_Email_copy.py", line 94, in xml_data
xmlMsg = num.getElementsByTagName('msg').firstChild.nodeValue
AttributeError: 'NodeList' object has no attribute 'firstChild'
Run Code Online (Sandbox Code Playgroud)
我建议采用不同的方法。下面是一个可以做你想做的事情的程序(我认为......)。它使用ElementTree API而不是 minidom。这大大简化了事情。
您已经发布了几个有关使用 minidom 解析 XML 文件的相关问题。我真的认为您应该研究 ElementTree (对于更高级的东西,请查看 ElementTree 的“超集”,lxml)。这两个 API 都比 minidom 更容易使用。
import xml.etree.ElementTree as ET
def xml_data():
root = ET.parse("opidea_2.xml")
logentries = root.findall("logentry")
content = ""
for logentry in logentries:
date = logentry.find("date").text
content += date + '\n '
msg = logentry.find("msg")
if msg is not None:
content += " Comments: \n " + msg.text + '\n\n'
else:
content += "No comment made."
print content
if __name__ == "__main__":
xml_data()
Run Code Online (Sandbox Code Playgroud)
使用您的 XML 示例时的输出(您可能希望在确切布局上做更多工作):
2012-08-06T21:01:52.494219Z
Comments:
PATCH_BRANCH:N/A
BUG_NUMBER:N/A
FEATURE_AFFECTED:N/A
OVERVIEW:N/A
Adding the SVN log size requirement to the branch
Run Code Online (Sandbox Code Playgroud)