如何在Python中将XML转换为JSON?

Geu*_*uis 63 python xml json

可能重复:
使用Python将XML转换为JSON?

我在App Engine上做了一些工作,我需要将从远程服务器检索的XML文档转换为等效的JSON对象.

我正在使用xml.dom.minidom解析返回的XML数据urlfetch.我也试图django.utils.simplejson将解析后的XML文档转换为JSON.我完全不知道如何把两者挂在一起.下面是我正在修改的代码:

from xml.dom import minidom
from django.utils import simplejson as json

#pseudo code that returns actual xml data as a string from remote server. 
result = urlfetch.fetch(url,'','get');

dom = minidom.parseString(result.content)
json = simplejson.load(dom)

self.response.out.write(json)
Run Code Online (Sandbox Code Playgroud)

Mar*_*ech 77

xmltodict(全面披露:我写的)可以帮助你的XML转换为一个字典+列表+弦结构,下面这个"标准".它是基于Expat的,所以它非常快,不需要在内存中加载整个XML树.

拥有该数据结构后,可以将其序列化为JSON:

import xmltodict, json

o = xmltodict.parse('<e> <a>text</a> <a>text</a> </e>')
json.dumps(o) # '{"e": {"a": ["text", "text"]}}'
Run Code Online (Sandbox Code Playgroud)

  • xmltodict似乎有一个"unsarse"方法,现在将执行反向操作 (5认同)
  • 你写过逆?我想,我会对这种动物感兴趣. (3认同)

Ant*_*pos 26

Soviut对lxml客体化的建议很好.使用特殊的子类simplejson,您可以将lxml objectify结果转换为json.

import simplejson as json
import lxml

class objectJSONEncoder(json.JSONEncoder):
  """A specialized JSON encoder that can handle simple lxml objectify types
      >>> from lxml import objectify
      >>> obj = objectify.fromstring("<Book><price>1.50</price><author>W. Shakespeare</author></Book>")       
      >>> objectJSONEncoder().encode(obj)
      '{"price": 1.5, "author": "W. Shakespeare"}'       
 """


    def default(self,o):
        if isinstance(o, lxml.objectify.IntElement):
            return int(o)
        if isinstance(o, lxml.objectify.NumberElement) or isinstance(o, lxml.objectify.FloatElement):
            return float(o)
        if isinstance(o, lxml.objectify.ObjectifiedDataElement):
            return str(o)
        if hasattr(o, '__dict__'):
            #For objects with a __dict__, return the encoding of the __dict__
            return o.__dict__
        return json.JSONEncoder.default(self, o)
Run Code Online (Sandbox Code Playgroud)

有关用法的示例,请参阅docstring,基本上您将lxml的结果传递objectify给实例的encode方法objectJSONEncoder

请注意,Koen的观点在这里非常有效,上面的解决方案仅适用于简单嵌套的xml,并且不包括根元素的名称.这可以修复.

我在这里列出了这个课程:http://gist.github.com/345559

  • 如果我的标签有几个具有相同标签名称的子项怎么办? (2认同)

Koe*_*Bok 14

我认为XML格式可以如此多样化,如果没有非常严格的XML格式,就不可能编写可以做到这一点的代码.这就是我的意思:

<persons>
    <person>
        <name>Koen Bok</name>
        <age>26</age>
    </person>
    <person>
        <name>Plutor Heidepeen</name>
        <age>33</age>
    </person>
</persons>
Run Code Online (Sandbox Code Playgroud)

会成为

{'persons': [
    {'name': 'Koen Bok', 'age': 26},
    {'name': 'Plutor Heidepeen', 'age': 33}]
}
Run Code Online (Sandbox Code Playgroud)

但这会是什么:

<persons>
    <person name="Koen Bok">
        <locations name="defaults">
            <location long=123 lat=384 />
        </locations>
    </person>
</persons>
Run Code Online (Sandbox Code Playgroud)

明白了吗?

编辑:刚刚发现这篇文章:http://www.xml.com/pub/a/2006/05/31/converting-between-xml-and-json.html

  • @George这篇文章是关于往返XML和JSON的一般问题.这与这个话题密切相关.不要让JavaScript代码最终让你失望. (9认同)

Jef*_*uer 8

Jacob Smullyan编写了一个名为pesterfish的实用程序,它使用effbot的ElementTree将XML转换为JSON.