C++ 序列化的良好设计

gri*_*ble 6 c++ architecture serialization

我目前正在寻找一个好的面向对象设计来序列化 C++/Qt 应用程序。
想象一下基于树结构组织的应用程序的类,使用复合模式实现,如下图所示。

我想到的两个可能的原则:

1.)
将 save()/load() 函数放在每个必须可序列化的类中。如果多次看到这种情况,通常会使用 boost 来实现。在课堂上的某个地方你会发现这样的东西:

friend class boost::serialization::access;
template<class Archive>
void serialize(Archive & ar, const unsigned int version)
{
    ar & m_meber1;
}
Run Code Online (Sandbox Code Playgroud)

您还可以将其分为 save() 和 load()。但这种方法的缺点是:
如果你想在两个月后更改序列化(更改为 XML、HTML 或一些非常奇怪的东西,boost 不支持),你必须采用所有数千个类。我认为这不是一个好的面向对象设计。
如果您想同时支持不同的序列化(XML、二进制、ASCII,等等......),则 80% 的 cpp 仅用于序列化函数。

2.)
我知道boost还提供了序列化的非侵入式版本

“http://www.boost.org/doc/libs/1_49_0/libs/serialization/doc/tutorial.html”

因此,另一种方法是实现一个迭代器,它迭代复合树结构并序列化每个对象(以及一个用于反序列化的迭代器)
(我认为这就是 .NET-Framework 的 XmlSerializer-Class 所做的,但我不是真的很熟悉.NET)
这听起来更好,因为单独的 save() 和 load() ,并且如果序列化发生变化,只有一个地方需要更改。
所以这听起来更好,但是:
- 你必须为你想要序列化的每个参数提供一个 setter() 和一个 getter() 。(所以,不再有私有数据了。(这是好还是坏?))
- 你可能有一个很长的继承层次结构(超过 5 个类)挂在复合树上。
那么如何调用派生类的setter()/getter()呢?当您只能调用基本复合组件的接口函数时。

另一种方法是将对象数据序列化为单独的抽象格式。所有可能的后续序列化(XML、TEXT,任何可能的序列化)都从中获取数据。一种想法是将其序列化为 QDomNode。但我认为额外的抽象会降低性能。

所以我的问题是:
有谁知道一个好的序列化面向对象设计吗?
也许来自其他编程语言,如 JAVA、Python、C# 等......

谢谢。

Mat*_* M. 5

谨防序列化。

序列化就是拍摄内存中表示的快照并在稍后恢复它。

这一切都很棒,除了当您考虑使用较新版本的软件加载以前存储的快照(向后兼容性)或(上帝禁止)使用较旧版本的软件加载最近存储的快照时,它会开始磨损。前向兼容性)。

许多结构可以轻松处理向后兼容性,但是向前兼容性要求您的新格式与其之前的迭代非常接近:基本上,只需添加/删除一些字段,但保持相同的整体结构。

问题在于,出于性能原因,序列化往往将磁盘上的结构与内存中的表示联系起来。更改内存中的表示需要弃用旧存档(和/或迁移实用程序)。

另一方面,消息传递系统(这就是 google protobuf)是将交换的消息结构与内存表示解耦,以便您的应用程序保持灵活性。

因此,您首先需要选择是实现序列化还是消息传递


现在您是对的,您可以在类内部或外部编写保存/加载代码。这又是一个权衡:

  • 类内代码可以立即访问所有成员,通常更高效、更直接,但灵活性较差,因此它与序列化齐头并进
  • 类外代码需要间接访问(getters、访问者层次结构),效率较低,但更灵活,因此它与消息传递密切相关

请注意,隐藏状态没有缺点。Aclass没有(真正的)隐藏状态:

  • 缓存(mutable值)就是这样,它们可以丢失,不用担心
  • 隐藏类型(认为FILE*或其他句柄)通常可以通过其他方式恢复(例如序列化文件名)
  • ...

我个人混合使用两者。

  • 缓存是为当前版本的程序编写的,并在v1. v1新代码被编写为可与和 一起使用v2,并v1默认写入,直到以前的版本消失;然后切换到写作v2(假设很容易)。有时,大规模重构会使向后兼容性变得太痛苦,我们此时将其放在地板上(并增加主要数字)。
  • 另一方面,与其他应用程序/服务和更持久的存储(数据库或文件中的 blob)的交换使用消息传递,因为我不想在未来 10 年里将自己束缚于特定的代码结构。

注意:我正在研究服务器应用程序,因此我的建议反映了此类环境的具体情况。我想客户端应用程序必须永远支持旧版本......

  • 感谢您的详细陈述。我想我找到了我正在寻找的东西 http://www.riehle.org/computer-science/research/1996/plop-1996-serializer.pdf 顺便说一句,我正在开发一个大型 CAD 应用程序,我们必须在其中序列化大量的几何信息。 (2认同)