DOCX 格式相对于 DOC 的优势

Nar*_*rek 9 xml xml-serialization

今天无意中发现.docx是同一个.zip(或者说它们之间没有太大区别)。当您将 .docx 更改为 .zip 并使用 WinRAR 打开时,您会在文件夹中看到一堆 XML 文件。在该 XML 文件中,它存储了文本、字体、所有者、上次修改等信息。总之,所有信息都存储为 XML 数据。

但同样不适用于 .doc 扩展文件。不可能以 .rar 的 .zip op 格式打开它们。

那么问题来了:微软改变了存储数据的方式,用XML存储.docx的数据有什么好处?事实上,我想知道的不是 XML 格式的优势,而是为什么 Microsoft 使用多个 XML 文件来存储 .docx 数据。原来 .docx 并不是根目录中的新格式。

mmx*_*mmx 12

一个.docx文件可以存储嵌入的资源,如图片文件,而不仅仅是XML文件。他们没有使用 base64 或其他东西对内容进行编码并将其存储在 XML 文件中或发明另一种二进制序列化格式,而是决定使用标准的 ZIP 格式。

除此之外,XML 是一种非常冗长的文件格式,其中包含许多冗余模式。您可以获得 XML 文件的高压缩率。

顺便说一句,我并没有真正理解“欺骗我们”的部分。从头开始发明一种新的神秘文件格式还是使用标准的已知格式更好?


小智 5

维基百科的文章概括起来相当漂亮:

“微软在采用开放文件格式方面面临越来越大的压力,特别是一些国家通过了官方文件应该采用开放格式的规则。”

编辑: 压缩它很有意义,因为 XML 非常冗长,并且自然压缩得非常好。

  • “打开”并不意味着“可以解压缩”。 (3认同)
  • 除了压缩之外,压缩还有其他优点。它还充当多个文件的容器。 (3认同)