具有高摄取率的服务如何足够快地安装足够的硬盘?

jl6*_*jl6 13 hard-drive scaling

亚马逊、Facebook 和谷歌每天必须接收 TB,如果不是 PB,那么这是否意味着他们让人们以与构建常规服务器相同的方式在新机架中不断安装新硬盘和电缆,或者是否使用了不同的技术用于连接驱动器?

Dan*_*ght 16

我不知道他们中是否有人真的一次安装一台服务器的硬件。早在2008 年, MS 就开始构建其数据中心,将服务器放入密封和预先接线的服务器运输容器中,他们只需将这些服务器从卡车上卸下并插入电源/网络连接即可。虽然 08 版本是他们最近的数据中心的容器和传统的混合体,但后来他们采用了定制的预制设计,可以防风雨,不需要安装在单独的建筑物内。

无论惠普和IBM出售与预置的容器装满服务器,仅仅需要电源/数据连接来部署类似的软件包。

带有暴露在天气中的预制模块的微软博伊登弗吉尼亚数据中心。


rep*_*lay 7

谷歌内部开发了多种技术来存储这些海量数据。使用这些技术,他们实际上可以在不停机的情况下将卡车装载的硬盘添加到他们的集群中,但是是的,他们仍然需要有人这样做。

据我从谷歌博客中了解到,两个主要部分是谷歌文件系统,这是一个分布式文件系统,可以扩展到非常大的规模:谷歌文件系统

在谷歌文件系统之上,他们有大表,这是某种键值数据库,也可以扩展到巨大的规模:大表

为了保证高可用性,一切都冗余了很多次,在大多数情况下超过 3 次。


Dav*_*rtz 5

这是完全正确的。我记得有一次,Facebook 数据中心平均每天增加三辆装满硬盘和机架式服务器的牵引车。当然,他们有复杂的方案来使存储具有可扩展性和冗余性。例如,谷歌有GFS。Facebook 有 3 个数据中心专门用于他们的设备,每个数据中心都比两个沃尔玛还要大,并且计划新建一个比现有数据中心大四倍的数据中心。