Nar*_*rek 9 xml xml-serialization
今天无意中发现.docx是同一个.zip(或者说它们之间没有太大区别)。当您将 .docx 更改为 .zip 并使用 WinRAR 打开时,您会在文件夹中看到一堆 XML 文件。在该 XML 文件中,它存储了文本、字体、所有者、上次修改等信息。总之,所有信息都存储为 XML 数据。
但同样不适用于 .doc 扩展文件。不可能以 .rar 的 .zip op 格式打开它们。
那么问题来了:微软改变了存储数据的方式,用XML存储.docx的数据有什么好处?事实上,我想知道的不是 XML 格式的优势,而是为什么 Microsoft 使用多个 XML 文件来存储 .docx 数据。原来 .docx 并不是根目录中的新格式。
mmx*_*mmx 12
一个.docx文件可以存储嵌入的资源,如图片文件,而不仅仅是XML文件。他们没有使用 base64 或其他东西对内容进行编码并将其存储在 XML 文件中或发明另一种二进制序列化格式,而是决定使用标准的 ZIP 格式。
除此之外,XML 是一种非常冗长的文件格式,其中包含许多冗余模式。您可以获得 XML 文件的高压缩率。
顺便说一句,我并没有真正理解“欺骗我们”的部分。从头开始发明一种新的神秘文件格式还是使用标准的已知格式更好?
| 归档时间: |
|
| 查看次数: |
6977 次 |
| 最近记录: |