我在python中使用xml.etree.ElementTree创建了一个xml文件.然后我用
tree.write(filename, "UTF-8")
Run Code Online (Sandbox Code Playgroud)
将文档写出到文件中.
但是当我使用文本编辑器(linux上的vi)打开文件名时,标签之间没有换行符.一切都是一条大路线
如何以"漂亮的打印"格式写出文档,以便在所有xml标记之间有新的行(并且希望缩进等)?
谢谢!
Eri*_*gel 55
我发现了一种避免新库和重新分析xml的新方法.您只需将根元素传递给此函数(请参阅下面的说明):
def indent(elem, level=0):
i = "\n" + level*" "
if len(elem):
if not elem.text or not elem.text.strip():
elem.text = i + " "
if not elem.tail or not elem.tail.strip():
elem.tail = i
for elem in elem:
indent(elem, level+1)
if not elem.tail or not elem.tail.strip():
elem.tail = i
else:
if level and (not elem.tail or not elem.tail.strip()):
elem.tail = i
Run Code Online (Sandbox Code Playgroud)
xml.etree.ElementTree.Element实例上有一个名为" tail " 的属性.此属性可以在节点后设置字符串:
"<a>text</a>tail"
Run Code Online (Sandbox Code Playgroud)
我从2004年发现了一个链接,告诉我们使用这个"尾部"缩进元素的元素库函数.
例:
root = ET.fromstring("<fruits><fruit>banana</fruit><fruit>apple</fruit></fruits>""")
tree = ET.ElementTree(root)
indent(root)
# writing xml
tree.write("example.xml", encoding="utf-8", xml_declaration=True)
Run Code Online (Sandbox Code Playgroud)
结果"example.xml":
<?xml version='1.0' encoding='utf-8'?>
<fruits>
<fruit>banana</fruit>
<fruit>apple</fruit>
</fruits>
Run Code Online (Sandbox Code Playgroud)
Ste*_*ven 22
我认为最简单的解决方案是切换到lxml库.在大多数情况下,您只需将导入更改import xml.etree.ElementTree as etree为from lxml import etree或类似.
然后,您可以pretty_print在序列化时使用该选项:
tree.write(filename, pretty_print=True)
Run Code Online (Sandbox Code Playgroud)
(也可提供etree.tostring)
gim*_*mel 13
ElementTree中没有漂亮的打印支持,但您可以使用其他XML模块.
例如,xml.dom.minidom.Node.toprettyxml():
Node.toprettyxml([indent=""[, newl=""[, encoding=""]]])返回一个漂亮的文档版本.indent指定缩进字符串,默认为制表符; newl指定在每行末尾发出的字符串,默认为\n.
使用indent并newl满足您的要求.
例如,使用默认格式字符:
>>> from xml.dom import minidom
>>> from xml.etree import ElementTree
>>> tree1=ElementTree.XML('<tips><tip>1</tip><tip>2</tip></tips>')
>>> ElementTree.tostring(tree1)
'<tips><tip>1</tip><tip>2</tip></tips>'
>>> print minidom.parseString(ElementTree.tostring(tree1)).toprettyxml()
<?xml version="1.0" ?>
<tips>
<tip>
1
</tip>
<tip>
2
</tip>
</tips>
>>>
Run Code Online (Sandbox Code Playgroud)
小智 5
无需使用外部库,您可以通过将每个元素的 tail 属性设置为 来轻松实现输出中每个 XML 标记之间的换行符'\n'。
您还可以在此处指定换行符后的制表符数量。然而,在 OP 的用例选项卡中,使用外部库可能更容易实现,或者参见 Erick M. Sprengel 的答案。
我在尝试使用 python 中的 xml.etree.ElementTree 修改 xml 文档时遇到了同样的问题。就我而言,我正在解析 xml 文件,清除某些元素(使用 Element.clear()),然后将结果写回文件。
对于我清除的每个元素,输出文件中其标记后没有新行。
ElementTree 的 Element.clear() 文档指出:
该函数删除所有子元素,清除所有属性,并将 text 和 tail 属性设置为 None。
这让我意识到元素的文本和尾部属性是确定输出格式的方式。就我而言,我可以将已清除元素的这些属性设置为与清除之前相同的值。该尾部值最终用于'\n\t'根 xml 元素的第一级子元素,其中选项卡的数量指示输出中显示的选项卡的数量。
| 归档时间: |
|
| 查看次数: |
47787 次 |
| 最近记录: |