在他们的目标应用程序中,文件更有可能很大。块服务器可以执行大型顺序读取而不是许多小型读取,从而提高吞吐量。
\n\nGFS论文中提到的三个原因:
\n\n此外,出于局部性考虑,元数据分布在块服务器上,而不是主服务器上。当主服务器启动时,它会从所有块服务器加载元数据。因此,元数据越少意味着启动时间越短。
\n\n为了限制大块大小的影响,GFS 使用惰性空间分配,即如果文件大小只有 1 MB,GFS 只向文件系统请求 1 MB 而不是 64 MB,以避免由于内部碎片而浪费空间。
\n\n值得一提的是,GFS 的后继者 Colossus 将数据块大小从 64MB 减少到 1MB。
\n