与MongoDB或Cassandra相比,Greenplum或Vertica等数据库的优势

H6.*_*H6. 13 data-warehouse mongodb cassandra vertica greenplum

我目前正在与MongoDBApache Cassandra分别开展一些项目.我也在使用Solr,我正在使用它们处理"大量"数据(大约1-2TB).我上周第一次听说过GreenplumVertica,我不太确定,把它们放在我的大脑里.他们在我看来像Dataware House(DWH)解决方案,我还没有真正使用过DWH.而且他们似乎要花很多钱(例如Greenplum的1TB存储费用为6万美元).我目前没有处理Petabyte的数据,我想不会这样做,但像cassandra这样的产品似乎也能够处理这个

Cassandra是公认的NoSQL领导者,可以轻松扩展到太字节或数PB的数据.

通过http://www.datastax.com/why-cassandra

所以我的问题是:人们为什么要使用Greenplum&Co?与其他产品相比,是否有巨大的优势?

谢谢.

ser*_*aut 42

Cassandra,Greenplum和Vertica都以非常不同的方式处理大量数据.

一些组成的用例,每个数据库都有自己的优势:

使用cassandra:

tweets.insert(key:user, data:blob);
tweets.get(key:user)
Run Code Online (Sandbox Code Playgroud)

使用greenplum:

begin;
update account set balance = balance - 10 where account_id = 1;
update account set balance = balance + 10 where account_id = 2;
commit;
Run Code Online (Sandbox Code Playgroud)

使用Vertica:

select sum(balance)
over (partition by region order by account rows unbounded preceding)
from transactions;
Run Code Online (Sandbox Code Playgroud)


小智 12

我在电信行业工作.我们处理大型数据集和复杂的EDW(企业数据仓库)模型.我们从Teradata开始,它好几年了.然后数据呈指数级增长,正如您所知,Teradata的扩展成本很高.因此,我们评估了EMC,即green plum,oracle exadata,hp Vertica和IBM netteza.

在速度上,20个报告的生成如下:1.Vertica,2.Netteza,3.绿梅,4.oracle

压缩比:Vertica具有天然优势.其中IBM也很好.根据基准测试的最差是emc和oracle.一如既往,因为它们都希望销售大量的存储和硬件.

可伸缩性:所有都可以很好地扩展.

加载时间:emc在这里是最好的,其他人(teradata,Vertica,oracle,IBM)也很好.

并发用户查询:Vertica,emc,green plum,然后只有IBM.Oracle exadata在任何类型的查询案例中相对较慢,但比旧学校10g要好得多.

价格:Teradata> Oracle> IBM> HP> EMC

注意:需要比较苹果和苹果,核心,内存,数据量和报告的相同数量

我们选择Vertica作为硬件独立定价模型,降低价格和良好性能.现在,所有40多个用户都乐于在不等待的情况下生成报告,并且它们都适合低成本的hp dl380服务器.对于olap/edw用例来说非常棒.

所有这些分析仅适用于edw/analytics/olap案例.在任何硬件或系统上,我仍然是所有oltp,丰富的plsql,连接等的oracle粉丝.Exadata提供了不错的混合工作负载,但价格/性能比不合理,仍然需要将10g代码迁移到exadata最佳实践(类似MMP,批量处理等,并且比他们声称的耗时.


kim*_*305 7

我们已经在Hadoop工作了4年,而Vertica工作了2年.我们在MySQL中的表中存在大量的加载和索引问题.我们使用我们自己开发的分片解决方案来运行烟雾.我们本可以投入大量资金开发更复杂的分片解决方案,这本身就很痛苦.我们可以更加想到我们绝对需要在SQL数据库中保存哪些数据.

但最终,从MySQL切换到Vertica是我们选择的.Vertica的性能模式与MySQL有很大不同,后者带来了自己的麻烦.但是它可以非常快速地加载大量数据,而且它很擅长重载查询,这会让MySQL头疼.

我认为,Vertica是一种解决方案,当您已经投入SQL并需要更重的SQL数据库时.我不是专家,所以我无法告诉你,与Vertica相比,转换到Oracle或DB2会是什么样的,无论是在集成工作还是货币成本方面.

Vertica提供了许多我们几乎没有考虑过的功能.对于使用与我们不同的用例的人来说,这些可能非常有吸引力.


geo*_*son 6

我是Vertica DBA,之前是Vertica的开发人员.Michael Stonebreaker(Ingres,Vertica和其他数据库背后的人)对NoSQL有一些值得倾听的批评.

基本上,我认为这是Vertica的优点:

  • 它对大量数据的速度相当快
  • 它的性能与其他数据仓库解决方案类似(因此我可以收集),但它的优势在于集群和商用硬件.因此,您可以通过添加更多商品硬件来扩展.就每TB的总体成本而言,它看起来很便宜.(从记忆中得出的不是确切的引用.)
  • 同样,它用于数据仓库.
  • 您可以使用传统的SQL和表.它与众不同.

我不能和其他产品说话,但我相信它们中的很多都很好.

编辑:以下是Stonebreaker的演讲:http://www.slideshare.net/Dataversity/newsql-vs-nosql-for-new-oltp-michael-stonebraker-voltdb