我正在尝试为大数据分析设置一个测试平台(基本上大约 2 到 3 TB 的基础,轻微写入 [仅提供数据库],但可能出于分析目的读取密集查询)。
由于我对 vanilla PostgreSQL 有一定的经验(但有 10GB 的基础),我正在考虑尝试 9.1 新的同步复制来实现负载平衡。目标是让 Tableau 响应迅速。因此,我可以避免昂贵的 MPP GreenPlum、AsterData 等。
但是,我想知道: - 直接使用 MPP 数据库(例如 GreenPlum)是否是个好主意?(对于 2-3 TB,真的需要 Greenplum 吗?) - 一旦同步复制启动并运行,我应该如何配置我的应用程序?负载平衡是由主机完成还是需要其他解决方案(例如 Pgpool)?
谢谢你的见解!
postgresql ×1