标签: scalability

大多数大型数据库需要一个 DBA 团队才能扩展。他们不断与硬盘驱动器的限制作斗争，最终得到非常昂贵的解决方案（SAN 或大型 RAID、用于碎片整理和重新分区的频繁维护窗口等）。维护此类数据库的实际年度成本在 10 万美元到 100 万美元之间对我来说太陡了:)
最后，我们找到了几家公司，如 Intel、Samsung、FusionIO 等，它们刚刚开始销售基于 SLC 闪存技术的速度极快且价格合理的 SSD 硬盘。这些驱动器的随机读/写速度比市场上最好的旋转硬盘快 100 倍（每秒高达 50,000 次随机写入）。它们的寻道时间几乎为零，因此随机 I/O 的成本与顺序 I/O 相同，这对数据库来说非常棒。这些 SSD 驱动器每 GB 的成本约为 10-20 美元，而且它们相对较小（64GB）。

因此，似乎有机会通过简单地构建一个足够大的 RAID 5 SSD 驱动器阵列来避免以传统方式扩展数据库的巨额成本（只需花费几千美元）。然后我们不关心数据库文件是否碎片化，我们可以承受每秒 100 倍的磁盘写入，而不必将数据库分布在 100 个轴上。.

还有人对此感兴趣吗？我一直在测试一些 SSD 驱动器，可以分享我的结果。如果本网站上有人已经用 SSD 解决了他们的 I/O 瓶颈，我很想听听你的战争故事！

附注。我知道有很多昂贵的解决方案可以帮助实现可扩展性，例如久经考验的基于 RAM 的 SAN。我想明确一点，即使 5 万美元对我的项目来说也太贵了。我必须找到一个成本不超过 1 万美元且实施时间不长的解决方案。

戴夫、NXC 和 Burly，

感谢您的回复！我想澄清一下，“便宜”这个词在我的情况下非常重要。因此，我必须使用廉价的戴尔服务器（4K 美元的 2950 年代，只有 8 个内存条）。我已经安装了 32GB 的 RAM，所以我无法继续以这种方式扩展。此外，添加 RAM 并不能使您免于磁盘写入瓶颈，这是我现在的主要问题。

我曾经关心 SSD 的使用寿命，但在阅读了现代磨损均衡算法后，我很确定这些驱动器将持续足够长的时间。我的数据库每天写入 300GB，预计在 2009 年每天会超过 1TB。企业级 SSD 旨在在多年内每天处理大约 10TB 的写入。 …

raid hard-drive database ssd scalability

Den*_*kin

2011 06-26

25
推荐指数

2
解决办法

4203
查看次数

statsd 和 Graphite 的高可用、Web 可访问和可扩展部署

我想设置 statsd/graphite，以便我可以记录在 HTML 设备上运行的 JS 应用程序（即不在包含的 LAN 环境中，并且可能有大量我无法直接控制的传入数据）。

我的限制：

入口点必须说 HTTP：这是通过一个简单的 HTTP-to-UDP-statsd 代理解决的（例如 github 上的 httpstatsd）
必须抵抗单个服务器的故障（与墨菲定律作斗争：）
必须是水平可扩展的：webscale，宝贝！:)
架构应该尽可能简单（和便宜）
我的服务器是虚拟机
数据文件将存储在文件管理器设备上（使用 NFS）
我可以使用 tcp/udp 硬件负载平衡器

总之，数据路径：[client] -(http)-> [http2statsd] -(udp)-> [statsd] -(tcp)-> [graphite] -(nfs)-> [filer]

到目前为止我的发现：

扩展 http2statsd 部分很容易（无状态守护进程）
缩放 statsd 部分似乎并不简单（我想我最终会在石墨中得到不连贯的值，例如 sum、avg、min、max ...）。除非 HTTP 守护进程进行一致的散列以对密钥进行分片。也许是一个想法......（但接下来是 HA 问题）
缩放石墨部分可以通过分片（使用碳继电器）来完成（但这也不能解决 HA 问题）。显然，多个耳语实例不应写入相同的 NFS 文件。
缩放文件管理器部分不是问题的一部分（但 IO 越少越好:)
扩展 webapp 似乎很明显（虽然我没有测试过），因为它们只读取共享的 NFS 数据

所以我想知道是否有人有经验和最佳实践可以分享一个可靠的 statsd/graphite 部署？

http scalability high-availability graphite statsd

Dav*_*142

lucky-day

17
推荐指数

1
解决办法

1034
查看次数

哪些类型的系统必须“向上扩展”而不是“向外扩展”？

很长一段时间以来，我一直想知道是否有系统必须“纵向扩展”（到更强大、更昂贵的服务器上）而不是通过拆分到许多较小的服务器来“横向扩展”。

这样的系统是否存在，如果存在，是否有什么特别的东西会导致系统需要扩展而不是横向扩展？（例如，可能 ACID-complaint 数据库事务或其他强大的数据完整性要求会产生这种需求。）

由于向上扩展似乎比向外扩展带来更高的硬件成本，因此如果可能的话，这似乎是您想要避免的事情，但我不确定它是否总是可以避免的。

那么，是否存在无法横向扩展而必须纵向扩展的系统？什么可能导致这种情况，您将如何识别这样的系统？（它们通常是否具有一些共同的特征，可能使它们更容易识别？）

database scalability infrastructure

Dem*_*emi

2014 07-23

12
推荐指数

3
解决办法

806
查看次数

PostgreSQL 扩展到 64 核？

在这篇计算机世界文章中，它指定 PostgreSQL 可以扩展到 64 核的限制。这是否意味着一个 64 核的多核处理器？还是内核更少的多个处理器？

我问的原因是因为我试图找出 PostgreSQL 可以扩展到多少处理器，但当然这可能仅限于处理器的类型。但是，我一直在其他数据库中找到其他统计数据（即 Microsoft SQL Server在这里声明它可以扩展到 320 个逻辑处理器），并且他们没有指定它们的核心数。这是一个非常模糊的统计数据吗？

任何想法将不胜感激。谢谢！

postgresql database scalability

O_O*_*O_O

lucky-day

11
推荐指数

2
解决办法

1万
查看次数

AWS：使用单个 RDS 实例进行多区域设置

我正在尝试以多区域方案扩展我们的 Web 应用程序（PHP、MySQL、memcache）。目前，我们使用的设置在 ELB 和 RDS 实例后面有两个 EC2 实例，它们都在美国东部（弗吉尼亚）地区。

我们也希望在欧盟（爱尔兰）地区开展业务。这意味着那里至少有一个新的 EC2 实例（与其他实例相同，为相同的应用程序提供服务）。

我已经复制了所需的 AMI，设置了新实例，设置了相同的 ELB 配置（SSL 终止所需）并在 Route53 中配置了基于延迟的路由。它按建议工作。

但是，来自欧盟的客户存在速度问题。这是因为欧盟 EC2 实例连接到美国的 RDS 实例。据我所知亚马逊还没有启用RDS多区域复制。

您对如何在使用单个 RDS 实例时正确加速整个设置有什么建议吗？

另外，关于如何扩大规模的任何想法？理想情况下，出于各种原因，我们希望继续使用 RDS 技术。尽管如此，我愿意接受建议（我猜下一个想法是托管我们自己的 MySQL 服务器）。

scaling scalability amazon-ec2 amazon-web-services amazon-rds

Ion*_*Ion

lucky-day

11
推荐指数

2
解决办法

1万
查看次数

我有一个网站，可以存储用户个人资料图片。每个图像都存储在用户特定的目录 (Linux) 中。目前我有 30 多个客户群，这意味着我将拥有 30 多个文件夹。但是我当前的 Linux 机器（ext2/ext3）不支持创建超过 32000 个目录。我该如何度过这一关？即使是 YouTube 的人也有同样的问题，视频缩略图。但是他们通过迁移到 ReiserFS 解决了这个问题。我们不能有更好的解决方案吗？

更新：当在 IRC 中询问时，人们询问是否将其升级到 ext4，它有 64k 的限制，当然你甚至可以通过它。或者内核黑客来改变限制。

更新：如何根据用户 ID 范围将用户群拆分为文件夹。意思是一个文件夹中的 1-1000，另一个文件夹中的 1000-2000。这似乎很简单。你说呢，伙计们？

坦白说，就没有其他办法吗？

linux filesystems directory scalability

Non*_*-da

2012 06-13

10
推荐指数

2
解决办法

2万
查看次数