是否有分布式 SAN/存储系统?

Joe*_*oel 10 storage-area-network distributed-filesystems network-storage

像许多其他地方一样,我们要求用户不要将文件保存到他们的本地机器上。相反,我们鼓励将它们放在文件服务器上,以便其他人(具有适当权限)可以使用它们并正确备份文件。

这样做的结果是,大多数用户的大硬盘驱动器基本上都是空的。现在是2010年。肯定有一个系统可以让您将空白空间变成虚拟 SAN 或文档库?

我设想的是一个客户端程序,它被推送到与中央服务器协调的用户 PC 上。该服务器在用户看来就像一个普通的文件服务器,但它不保留整个文件内容,它只是记录可以在不同用户 PC 中找到这些文件的位置。然后它与正确的客户端协调以提供文件请求。客户端软件将能够直接响应此类请求,并且足够智能以在本地缓存最近的文件。对于冗余,服务器可以确保将文件复制到多台 PC,也许允许您在不同位置定义组,以便整个存储库的实例位于每个组中,以防止在一栋建筑物中发生灾难并摧毁其他所有东西。

显然你不会把你的数据库服务器指向这里,但对于更简单的事情,我看到了几个优点:

  • 文件通常可以从较近(或本地)的机器传输。
  • 分布网络连接,而不是将所有文件传输集中在一个连接上
  • 磁盘空间会随着您的公司自动增长。
  • 最终应该更便宜,因为您不需要保留一组单独的磁盘

我也可以看到一些缺点:

  • 如果计算机必须在繁忙时段提供或接受大文件传输,则用户 pc 性能偶尔会下降。
  • 写入必须在网络上多次传播(尽管我怀疑这不是什么大问题,因为在大多数地方读取比写入更多)
  • 仍然需要一种方法偶尔将数据的完整副本发送到异地,这会使差异化变得非常困难

将此视为完全位于您公司 LAN 中并利用您现有用户设备的云存储系统。

我们旧的主文件服务器将在大约 2 年后退役,我正在考虑用一个小型 SAN 替换它。我们当前的文件服务器使用了大约 400GB 的 1TB 共享空间。因为我们的备份空间有限,所以我们只把它缩小到那么小。我希望在更换后将可用空间扩展到至少 4TB,如果价格像我预期的那样下降,可能会更多。我想像这样的东西会更合适。作为一所学校,我们有几个计算机实验室可以让我继续运行,它们非常适合为这样的系统添加一点额外的冗余。

除了极少数例外,我们的用户在他们的 120GB 硬盘驱动器中填充了不到 40GB,这意味着我可以轻松地为每台机器预留 65GB。而且这只会增加,因为更新的机器配备 250Gb 驱动器,甚至那些很快就会变得更大。到更换文件服务器时,考虑到我们的桌面更换计划,我希望这样的系统能够提供 5TB 的可用存储空间,甚至允许冗余和历史记录。

不幸的是,我能找到的最接近的东西是Dienst,它只是一篇可以追溯到 1994 年的论文。我只是在搜索中使用了错误的流行语,还是真的不存在?如果没有,我错过了一个很大的缺点吗?

Sve*_*ven 0

我想到的最接近的是 Google 的 MapReduce 或免费的 Hadoop 替代品,但它的设计目的是扩展到真正大型 Web 应用程序的 PB 区域。

一般来说,您的场景并不是我真正想尝试的,因为我猜想管理此附加服务的计算机的管理开销将远远超过您可能从中获得的任何好处。

另外,我认为存在一定的风险,即 Windows(或任何其他操作系统)中可能存在未发现的问题,这些问题可能会导致快速传播的蠕虫病毒的漏洞,无论如何,该漏洞都可能在几分钟内摧毁您的整个网络。您的系统配置良好且安全,这将占用您的所有数据存储池。

除此之外,我不太确定客户端系统上的可用磁盘容量是否会继续增长,因为我猜测将来会有更多的应用程序被移植到网络上,包括办公应用程序甚至 Photoshop 之类的东西,这将导致(再次)大力推动瘦客户端。