背景:我刚刚开始使用scikit-learn,并在页面底部阅读有关joblib和pickle的内容.
使用joblib替换pickle(joblib.dump和joblib.load)可能更有意思,它对大数据更有效,但只能腌制到磁盘而不是字符串
我读了关于Pickle的问答 ,Python中常见的pickle用例,并想知道这里的社区是否可以分享joblib和pickle之间的差异?应该何时使用另一个?
是否有将数据缓存在磁盘上的 python pandas 实现,以便我可以避免每次都重现它?
特别是get_yahoo_data对于财务有没有缓存方法?
一个非常加分的是:
Where exactly does serialization comes into the picture? I read about serializtion on the 'net and I have come to know that
它是一个接口,如果在类中实现,意味着它可以被不同的序列化器自动序列化和反序列化.
给我一个很好的理由,为什么以及什么时候需要序列化一个类?假设一旦序列化,究竟发生了什么?
c# ×1
caching ×1
financial ×1
java ×1
marshalling ×1
oop ×1
pandas ×1
persistence ×1
pickle ×1
python ×1
scikit-learn ×1