在Python中序列化用户定义的类

tjs*_*ons 3 python serialization json

有一个关于序列化我定义的类的问题.我有一些课程

class Foo:
     def __init__(self, x, y):
          self.x = x, self.y = y

     def toDict(self):
          return dict(Foo = dict(x = self.x, y = self.y))
Run Code Online (Sandbox Code Playgroud)

然后是一个可以包含多个Foos的类,例如:

class Bar:
     def __init__(self):
          self.foos = [Foo(a, b), Foo(1, 2)]
Run Code Online (Sandbox Code Playgroud)

虽然这是对真实结构的粗略过度简化(它得到了更多,更多嵌套),但这是一个相当不错的概述.这个实际数据来自一个没有任何实际结构的伪XML文件,所以我根据给出的规范编写了一个解析器,所以我现在把所有数据放在我定义的一系列类中,实际结构体.

我想要做的就是把我拥有的这些数据并将其吐出到JSON中,但我真的没有看到一个好的方法(我是Python的新手,这是我的第一个真正的项目).

我在Foo中定义了一个方法toDict(),它从信息中创建了一个字典,但是当我尝试使用多个Foos序列化Bar时,这显然不会像我希望的那样.

有没有人有这样做的好方法?在过去的几天里,这是一个非常不间断的学习/代码节目,我对此缺乏想法,这是该项目的最后一部分.我知道Python的JSON模块,但是这对我将数据放入字典(或类似的东西)这个我可以传递给json.dump()的特殊问题没有帮助.

如果我能以任何方式澄清,请告诉我.

谢谢,TJ

Kat*_*iel 5

几条评论.第一:

  • xml.dom.minidom是一个内置的Python DOM实现.显然,如果文件实际上不是XML,你将无法使用它的内置解析函数,但看起来你正在构建一个类似于树的结构,在这种情况下你也可以使用minidom.

好的,从此以后我会假设您有充分的理由编写自己的树型结构而不是使用内置结构.

  • 你确定节点应该是类吗?当你真正需要的是一堆嵌套的dicts 时,这似乎是一个非常多的结构:

    root = {
        "foo1": { "bar1": "spam", "bar2": "ham"},
        "foo2": { "baz1": "spam", "baz2": "ham"},
    }
    
    Run Code Online (Sandbox Code Playgroud)

    你明白了.

好的,也许您确定需要将各个节点作为类.在那种情况下,他们都应该从某些BaseNode类继承,对吧?毕竟,它们基本上是相似的东西.

  • 在这种情况下,定义一个BaseNode.serialise方法,该方法有效地打印有关自身的一些信息,然后调用serialise其所有子项.这是一个递归问题; 你也可以使用递归解决方案,除非你的树真的真的嵌套了.

    json库允许您子类化JSONEncoder以执行此操作.

    >>> import json
    >>> class ComplexEncoder(json.JSONEncoder):
    ...     def default(self, obj):
    ...         if isinstance(obj, complex):
    ...             return [obj.real, obj.imag]
    ...         return json.JSONEncoder.default(self, obj)
    ...
    >>> dumps(2 + 1j, cls=ComplexEncoder)
    '[2.0, 1.0]'
    >>> ComplexEncoder().encode(2 + 1j)
    '[2.0, 1.0]'
    >>> list(ComplexEncoder().iterencode(2 + 1j))
    ['[', '2.0', ', ', '1.0', ']']
    
    Run Code Online (Sandbox Code Playgroud)