car*_*tor 2 mysql linux innodb ext3 centos5
我正在为使用 InnoDB 的 MySQL 5.6 寻找 ext3 文件系统块大小的建议。
在 VMware ESXi 5 中运行 CentOS 5.4 VM,在 NetApp FibreChannel LUN(具有 4k 块大小)上运行 VMFS 5 数据存储。使用 O_DIRECT,innodb_flush_log_at_trx_commit = 2,14G 缓冲池,并且 db 执行 OLTP,偶尔会处理一些处理大量数据的大型查询。有些表有几 GB 或更多,有些则很小。表和 ibdata 文件在一个文件系统上,binlogs 和 ib_logfiles 在另一个文件系统上,因此它们可以具有不同的块大小。
我知道 InnoDB 使用 16k 块大小,这不是用户可配置的,所以我想知道是否值得将 ext3 块大小设置为匹配,而不是 4k 默认值。
谢谢!
文件系统块大小应该不会对 InnoDB 产生不良影响。我不是在谈论微不足道的 cpu 绑定性能,因为它的文件系统开销非常小。您应该担心的是 IO 性能。
当 mysql 需要从磁盘读取 InnodDB 页面时,它会访问文件的 inode 结构。ext3 inode 包含对 15 个块的引用。前12个直接指向数据块。其余 3 个指向块,包含其他块引用,这些引用也可能是直接的或间接的。
因此,如果 InnoDB 页面位于文件的第一个 (12*4)=48KB - 它将在 2 个 IO 操作中获取:1 个用于 inode,第二个用于数据块,如果它位于第一个 (12*4 + 1024)*4 =4.2MB 3 个操作,(12+1024+1024^2)*4=4GB - 4 个操作,(12*bs+1024+1024^2+1024^3)*4=4TB - 5 个操作。
1024是4k块中4byte块引用的个数。
预读(写入的预分配)和缓存将减少此计数,允许一次读取/写入多个块。
4k的块大小与linux内存页面大小相同,使页面缓存更容易编码。
第一次写入 Innodb page 时,ext3 会预先分配 8 个连续块(32kb)并写入其中的 4 个,其他 4 个将被丢弃(或用于多一个页面)。对此页面的所有更改都将存储在相同的块中。
减少块大小只会节省磁盘空间,因为 1 块是存储在磁盘上的最小数据单位。
增加它(有一些内核补丁可以做到)将提高非常大文件的性能,但不会像您想象的那样提高。将它与 InnoDB 页面大小匹配是没有意义的,因为在绝大多数情况下,一个 InnoDB 页面的数据块将顺序放置在磁盘上,并将在单个操作中读取/写入。