如果我有一个定义类的脚本:
script = """
class myClass:
def __init__(self):
self.name = 'apple'
self.color = 'green'
"""
Run Code Online (Sandbox Code Playgroud)
然后在自己的命名空间dict中执行此脚本:
NS = {}
exec script in NS
Run Code Online (Sandbox Code Playgroud)
然后创建一个类的实例并将其pickle:
a = NS['myClass']()
import pickle
save = pickle.dumps(a)
Run Code Online (Sandbox Code Playgroud)
现在,如果我试图取消它:
load = pickle.loads(save)
Run Code Online (Sandbox Code Playgroud)
我收到了错误
AttributeError: 'module' object has no attribute 'myClass'
Run Code Online (Sandbox Code Playgroud)
我认为这不起作用,因为python不知道在哪里找到myClass以重建对象.但myClass确实存在于NS dict中.有没有办法告诉pickle在哪里找到它正在加载的对象的类?
您实际上可以更进一步,让对象重建为您想要的任何类型.
import pickle
import copy_reg
class myClass(object):
def __init__(self):
self.apple = 'banana'
class otherclass(object):
def __init__(self):
self.apple = 'existential woe'
def pickle_an_object(o):
print "pickling %s" % str(o)
return otherclass, (o.apple,)
copy_reg.pickle(myClass, pickle_an_object)
foo = myClass()
s = pickle.dumps(foo)
del myClass
del otherclass
class otherclass(object):
def __init__(self, appletype):
self.apple = 'not %s' % appletype
o2 = pickle.loads(s)
print o2.apple
Run Code Online (Sandbox Code Playgroud)
基本的想法是,你把你的班级打包成各种各样的"特洛伊木马",在那里它的重建导致了与原来不同的类的实例化.
这不要紧,什么otherclass对酸洗侧载.重要的是它与"目标"类存在于同一模块路径中 - pickle只是将模块名称的字符串表示形式放入序列化流中.
那么,要详细分解上面代码中发生的事情:
myClass.这可以通过copy_reg或__reduce_ex__功能完成.otherclass"(这是一个假人.你不需要otherclass酸洗方面的"真实"内容,因为所有进入pickle的都是模块/类名).otherclass存在的地方.otherclass使用自定义酸洗功能返回的元组中的数据进行实例化.Python可以非常强大!
我发现了一个解决方案。问题似乎是在 dict 中执行代码阻止了 python 找出类的定义位置。解决方法是创建一个空模块,执行模块中的代码,然后将该模块添加到 sys.modules 中,这样python就知道了。
script = """
class myClass:
def __init__(self):
self.name = 'apple'
self.color = 'green'
"""
import imp, sys
moduleName = 'custom'
module = imp.new_module(moduleName)
exec script in module.__dict__
sys.modules[moduleName] = module
Run Code Online (Sandbox Code Playgroud)
现在可以pickle和unpickle类的实例:
import pickle
a = module.myClass()
s = pickle.dumps(a)
b = pickle.loads(s)
Run Code Online (Sandbox Code Playgroud)