有太多的选择,很难知道从哪里开始。我的要求是这些:
- 在 Linux 上运行
- 大多数文件的大小在 5-9 MB 之间。还会有大量的小型 jpg (100px x 100px)。
- 所有文件都需要通过 http 访问。
- 冗余——理想情况下,它将提供类似于 RAID 5 的 75% 的空间效率(在 RAID 5 中,这将这样计算:对于 4 个相同的磁盘,25% 的空间用于奇偶校验 => 75% 效率)
- 必须支持数 PB 的数据
- 可扩展的
- 在商品硬件上运行
此外,我寻找这些品质,尽管它们不是“要求”:
我想要一些关于哪种文件系统最适合给定要求的输入。我组织中的一些人倾向于 MogileFS,但我不相信该项目的稳定性和动力。根据我有限的研究,GlusterFS 和 Lustre 似乎得到了更好的支持......
想法?