Greenplum vs PostgreSQL

0at*_*man 10 sql database django postgresql greenplum

使用Greenplum而不是PostgreSQL在webapp(django)环境中使用和反对的论据是什么?

我的直觉反应是更喜欢PostgreSQL的开源方法和庞大的知识库.

我的配置(虽然我很想听听任何其他配置)是一个中型企业,有2个Web服务器和(目前)2个数据库服务器.

要比较的领域是二进制data crunching,replication我个人最喜欢的节点数量:communitiy support以及熟练的工程师支持.

使用Greenplum而不是PostgreSQL有什么优缺点?

duf*_*ymo 10

除了快速浏览您发送的链接外,我对Greenplum了解不多.数据仓库与事务操作数据存储不同.前者用于临时查询,统计分析,维度分析,读取 - 主要访问历史数据.后者用于实时,读/写操作数据.他们是免费的.

我猜你想要PostgreSQL.

谁在推动Greenplum,为什么?如果它被作为替代方案呈现,我会深入挖掘并反驳这一论点.

  • 你是对的,数据仓库与事务/运营数据存储不是一回事,但Greenplum恰好是两者兼而有之.Greenplum的主要特点是它在不同的物理服务器上通过PostgreSQL的多个实例(一个专有版本)并行存储和计算.这为事务和分析工作负载提供了好处.GP还具有用于数据仓库(即列式存储和压缩)的附加功能,但也旨在同时处理事务处理.但是,它可能仍然比PostgreSQL更糟糕. (7认同)

小智 7

Greenplum是PostgreSQL的MPP改编版.它针对大型数据集的仓储和/或分析进行了优化,在事务环境中无法很好地执行.如果您需要大型DW环境,请查看Greenplum.如果您需要OLTP或更小的数据库大小(低于10TB),那么请查看PostgreSQL.


0x0*_*FFF 7

Greenplum 是一个 MPP 分析 (OLAP) DBMS。PostgreSQL 是一个 OLTP DBMS。一般来说,市场上没有一个解决方案可以同时擅长 OLAP 和 OLTP,您可以在这里找到我的想法

WebApp 后端将始终创建 OLTP 工作负载。Greenplum 的事务处理开销很大,因为它是一个分布式系统,因此不要指望它能为您提供超过 500-600 TPS。相比之下,Postgres 通过正确的调整可以达到数十万的 TPS。

相比之下,当您需要 OLAP 工作负载时,Postgres 只能为您提供单主机处理、无动态分区消除分区、无压缩、无列式存储。虽然 Greenplum 能够在集群上并行处理数据。

因此,您正在寻找的解决方案是典型的数据仓库案例 - 使用 OLTP 解决方案来处理高事务工作负载,使用 ETL/ELT 将数据提取到 DWH,然后对其运行复杂的数据处理查询

目前 PostgreSQL 和 Greenplum 都是开源产品,所以你可以自由选择其中任何一个,但因为 PostgreSQL 社区是更大的 ATM