Kei*_*thB 10 c c++ binaryfiles
我有一个模拟读取我们创建的大型二进制数据文件(10到100的GB).出于速度原因,我们使用二进制 这些文件是系统相关的,从我们运行的每个系统上的文本文件转换而来,所以我不关心可移植性.这些文件当前是POD结构的许多实例,用fwrite编写.
我需要更改结构,所以我想添加一个文件版本号的标题,它会随着结构的变化而增加.由于我这样做,我想添加一些其他信息.我正在考虑结构的大小,字节顺序,以及创建二进制文件的代码的svn版本号.还有什么其他有用的东西可以添加吗?
Rod*_*ddy 14
根据我的经验,对你需要的数据进行二次猜测总是浪费时间.重要的是以可扩展的方式构建元数据.对于XML文件,这很简单,但二进制文件需要更多考虑.
我倾向于将元数据存储在文件END的结构中,而不是开头.这有两个好处:
我使用的最简单的元数据页脚看起来像这样:
struct MetadataFooter{
char[40] creatorVersion;
char[40] creatorApplication;
.. or whatever
}
struct FileFooter
{
int64 metadataFooterSize; // = sizeof(MetadataFooter)
char[10] magicString; // a unique identifier for the format: maybe "MYFILEFMT"
};
Run Code Online (Sandbox Code Playgroud)
在原始数据之后,元数据页脚和文件页脚被写入.
在读取文件时,请搜索end-sizeof(FileFooter).阅读页脚,并验证magicString.然后,根据metadataFooterSize回顾并读取元数据.根据文件中包含的页脚大小,您可以使用缺少字段的默认值.
正如KeithB指出的那样,您甚至可以使用这种技术将元数据存储为XML字符串,从而提供完全可扩展的元数据的优势,以及二进制数据的紧凑性和速度.
| 归档时间: |
|
| 查看次数: |
7808 次 |
| 最近记录: |