pickle的`persistent_id`的替代品?

Ric*_*rri 5 python persistence json yaml pickle

我一直在使用Python的pickle 模块来实现基于瘦文件的持久层.持久层(较大库的一部分)在很大程度上依赖于pickle的persistent_id功能将指定类的对象保存为单独的文件.

这种方法的唯一问题是pickle文件不是人类可编辑的,我更倾向于使用文本编辑器(例如,YAML或JSON)以人类可读和可编辑的格式保存对象.

您是否知道任何使用人类可编辑格式的库 提供类似于pickle的功能persistent_id?或者,您是否有建议在基于YAML或JSON的序列化库之上实现它们,而无需重写大量的 pickle

tal*_*nat 4

我自己还没有尝试过,但我认为您应该能够使用PyYAML使用他们所谓的“代表器”和“解析器”来优雅地完成此操作。

编辑

在与发帖者广泛交换意见后,以下是使用 PyYAML 实现所需行为的方法。

重要提示:如果一个Persistable实例有另一个此类实例作为属性,或者以某种方式包含在其属性之一内,则所包含的Persistable实例将不会保存到另一个单独的文件中,而是会内联保存在与父级相同的文件中Persistable实例。据我所知,这种限制也存在于 OP 基于 pickle 的系统中,并且对于他/她的用例来说可能是可以接受的。我还没有找到一个不涉及黑客攻击的优雅解决方案yaml.representer.BaseRepresenter

import yaml
from functools import partial

class Persistable(object):
    # simulate a unique id
    _unique = 0

    def __init__(self, *args, **kw):
        Persistable._unique += 1
        self.persistent_id = ("%s.%d" %
                              (self.__class__.__name__, Persistable._unique))

def persistable_representer(dumper, data):
    id = data.persistent_id
    print "Writing to file: %s" % id
    outfile = open(id, 'w')
    outfile.write(yaml.dump(data))
    outfile.close()
    return dumper.represent_scalar(u'!xref', u'%s' % id)

class PersistingDumper(yaml.Dumper):
    pass

PersistingDumper.add_representer(Persistable, persistable_representer)
my_yaml_dump = partial(yaml.dump, Dumper=PersistingDumper)

def persistable_constructor(loader, node):
    xref = loader.construct_scalar(node)
    print "Reading from file: %s" % id
    infile = open(xref, 'r')
    value = yaml.load(infile.read())
    infile.close()
    return value

yaml.add_constructor(u'!xref', persistable_constructor)


# example use, also serves as a test
class Foo(Persistable):
    def __init__(self):
        self.one = 1
        Persistable.__init__(self)

class Bar(Persistable):
    def __init__(self, foo):
        self.foo = foo
        Persistable.__init__(self)

foo = Foo()
bar = Bar(foo)
print "=== foo ==="
dumped_foo = my_yaml_dump(foo)
print dumped_foo
print yaml.load(dumped_foo)
print yaml.load(dumped_foo).one

print "=== bar ==="
dumped_bar = my_yaml_dump(bar)
print dumped_bar
print yaml.load(dumped_bar)
print yaml.load(dumped_bar).foo
print yaml.load(dumped_bar).foo.one

baz = Bar(Persistable())
print "=== baz ==="
dumped_baz = my_yaml_dump(baz)
print dumped_baz
print yaml.load(dumped_baz)
Run Code Online (Sandbox Code Playgroud)

从现在开始,当您想要将类的实例保存到单独的文件中时,请使用my_yaml_dump它。但不要在and内部使用它!不需要特殊的加载函数,只需使用.yaml.dumpPersistablepersistable_representerpersistable_constructoryaml.load

唷,这需要一些工作......我希望这会有所帮助!