处理从 boost 序列化中删除的变量

Vin*_*ent 5 c++ serialization boost

我查看了网上关于通过增加版本号并在该变量的序列化周围添加“if”来向序列化函数添加成员变量的示例。

但是如果我删除了一个成员变量,我该怎么办?我应该从序列化函数中删除它,boost 会处理它吗?

如果我删除一些在序列化函数中“序列化”的类,这可能会变得更糟,我是否需要只为该序列化代码保留它们,还是有另一种方法?

seh*_*ehe 5

背景/存档格式兼容性

Boost Serialization 在很多场景中都非常轻量级。

具体来说,如果您不使用对象跟踪/动态多态性,那么您的序列化流具有令人惊讶的回旋余地。

当通过(智能)指针(到基)进行序列化时,跟踪和多态性都成为一个因素。

标准库中的大多数东西,以及现代 C++ 中的东西,都支持值语义(例如所有标准容器),并且直接暗示,在这里玩得很好。

作为一个具体的例子,我有很多成功的序列化

std::map<std::string, boost::uuids::uuid>
Run Code Online (Sandbox Code Playgroud)

成二进制档案,并将该档案反序列化为

boost::unordered_map<std::string, boost::uuids::uuid>
// or
boost::flat_map<std::string, boost::uuids::uuid>
// or
std::vector<std::pair<std::string, boost::uuids::uuid> >
Run Code Online (Sandbox Code Playgroud)

这些类型都(不需要)存储类型信息,因此二进制流是兼容可交换的。

也许如果您想依赖这种“附带”兼容性,您可能需要编写大量测试

我有一种感觉,您应该能够设计一个简单的存档实现,而不是序列化实际数据,而是创建所涉及数据结构的“布局图”或“兼容性签名”。

这对于获得验证不同类型之间的存档兼容性的信心大有帮助

案例研究 1:更改布局

这与原始问题非常匹配:“删除字段后如何反序列化旧版本”。

在这里,关键是:serialize只是一个函数。你可以做任何你需要的。以一个简单的演示类为例,它经历了两个版本:

struct MyType {
    MyType();
    MyType(std::string const& v);

  private:
    friend class boost::serialization::access;
    template <typename Ar> void serialize(Ar&, unsigned);

#if DEMO_VERSION == 0

    bool hasValue;
    std::string value;

#elif DEMO_VERSION == 1

    boost::optional<std::string> value;

#endif
};
Run Code Online (Sandbox Code Playgroud)

显然,版本会有不同的实现。

诀窍是反序列化为临时变量,然后根据您的业务规则将旧语义映射到新语义上:

#if DEMO_VERSION == 0
MyType::MyType()                     : hasValue(false)          {}
MyType::MyType(std::string const &v) : hasValue(true), value(v) {}

template <typename Ar> void MyType::serialize(Ar& ar, unsigned /*file_version*/) {
    ar & hasValue & value; // life was simple in v0
}

#elif DEMO_VERSION == 1
MyType::MyType()                     : value(boost::none)       {}
MyType::MyType(std::string const &v) : value(v)                 {}

template <typename Ar> void MyType::serialize(Ar& ar, unsigned file_version) {
    switch (file_version) {
        case 0: {
            assert(Ar::is_loading::value); // should not be writing old formats
            //
            bool        old_hasValue;      // these fields no longer exist
            std::string oldValue;

            ar & old_hasValue & oldValue;

            // translate to new object semantics/layout
            value.reset();
            if (old_hasValue) value.reset(oldValue);

            break;
        }
        default: // v1+
            ar & value;
    }
}
#endif
Run Code Online (Sandbox Code Playgroud)

您可以在 Coliru 上实时看到此过程,其中程序v0将对象写入v0.dat,该程序v1成功读取(并以新格式序列化):

Live On Coliru

BOOST_CLASS_VERSION(MyType, DEMO_VERSION)
#include <fstream>

namespace demo {
    template <typename T> void serialize(std::ostream& os, T const& obj) {
        {
            boost::archive::text_oarchive oa(os);
            oa << obj;
        }
        os.flush();
    }

    template <typename T> void save(std::string const& fname, T const& payload) {
        std::ofstream ofs(fname, std::ios::binary);
        serialize(ofs, payload);
    }

    MyType load(std::string const& fname) {
        std::ifstream ifs(fname, std::ios::binary);

        MyType obj;

        boost::archive::text_iarchive ia(ifs);
        ia >> obj;

        return obj;
    }
}

int main(int, char** cmd) {
    std::cout << "Running " << *cmd << " with DEMO_VERSION=" << DEMO_VERSION << "\n";
    using namespace demo;

#if DEMO_VERSION == 0

    MyType payload("Forty two");
    save     ("v0.dat", payload);  // uses v0 format
    serialize(std::cout, payload); // uses v0 format

#elif DEMO_VERSION == 1

    auto loaded = load("v0.dat");  // still reads the v0 format
    serialize(std::cout, loaded);  // uses v1 format now

#endif
}
Run Code Online (Sandbox Code Playgroud)

印刷:

for v in 0 1
do
    g++ -std=c++11 -Os -Wall -DDEMO_VERSION=$v main.cpp -o v$v -lboost_system -lboost_serialization
    ./v$v
done
Running ./v0 with DEMO_VERSION=0
22 serialization::archive 11 0 0 1 9 Forty two
Running ./v1 with DEMO_VERSION=1
22 serialization::archive 11 0 1 0 0 1 0 9 Forty two
Run Code Online (Sandbox Code Playgroud)

案例研究 2:更改/删除的类型

就像你说的,可能最简单的方法是保留旧类型以进行间接反序列化。

参考上面的“背景/存档格式兼容性”部分,当然还有另一种选择,只要您知道自己在做什么。

让我们假设上述示例(“案例研究 1”)略有不同,并且使用了PoorMansOptional<std::string>由 a 替换的 a boost::optional<std::string>。您可以找出反序列化的等效字段。

请注意可能散布的额外项目版本字段。上面提到的容器示例中的项目之间不存在这样的字段。