为什么git将文件内容存储为blob?

lol*_* ol 4 git blob

这个问题可能看起来微不足道,但是我很难想出将文件内容存储为blob而不仅仅是原始格式(例如文本文件)的明确优势.

通常,使用blob代替媒体的其他存储格式:图像,视频,音频等 git,至少我通常使用它的方式,通常跟踪文本文件的修订而不是多媒体.

正式总结:将文件内容存储为blob(转换为二进制数据)而不是修订的原始格式(例如将其保留为文本)有什么好处?

Die*_*Epp 8

"Blob"只表示一个字节序列.Git中的blob将包含与文件完全相同的数据,只是blob存储在Git对象数据库中,文件存储在文件系统中.

因此格式没有区别,唯一的区别是它们的存储方式.

例如,如果将图像添加hello.jpg到存储库,然后提交它,则将拥有相同数据的两个副本:

  • 您将在磁盘上有一个名为的文件hello.jpg,其中包含JPEG数据,

  • 您将在Git对象数据库中有一个blob,它以其内容的哈希命名,其中包含完全相同的 JPEG数据,格式相同.

数据库可以使用一些花哨的技巧来有效地存储数据,包括压缩和使用增量,但最终它仍然存储与原始文件中完全相同的数据.

文本文件也不例外."Text"只是您可以存储在二进制文件中的特定类型的数据.