rav*_*nur 7 mapreduce analytic-functions nosql
我正在寻找NoSQL支持分析功能(AF简称)的任何系统(最好是开源),如Oracle/SQL Server/Postgres.我没有找到任何内置函数.我已经阅读了一些内容,Hive但它没有AF(windows,first_last值,ntiles,lag,lead等)的实际特征,只是直方图和ngrams.还有一些NoSQL系统(Redis例如)支持map/reduce,但我不确定是否AF可以用它替换它.
我想进行性能比较,选择Postgres或NoSQL系统.
简而言之:
NoSQL系统AFAF吗?它快速,可靠,易于使用.PS.我试图让我的问题更有建设性.
当某些函数涉及某种聚合(平均值、中位数、标准差)或某种排序(第一个、最后一个)时,它会使用所有现有数据的知识。
如果您想要一个开箱即用支持 AF 的分布式 NOSQL 解决方案,系统将需要依赖一些集中式索引和元数据来保存所有节点中的数据信息,从而拥有一个主节点,并且可能存在单点故障。
您必须询问您希望使用 NoSQL 实现什么目标。您想要无模式表吗?分布式数据?对于非常简单的查询有更好的原始性能?
根据您的需求,我在这里看到三种主要选择:
1 - 使用无单点故障的分布式NoSQL(即:Cassandra)来存储数据并使用map/reduce来处理数据并生成所需功能的结果(几乎所有主要的NoSQL解决方案都支持Hadoop)。需要注意的是,map/reduce 查询不是实时的(执行查询可能需要几分钟或几小时),并且需要额外的设置和学习。
2 - 使用支持多个服务器的传统 RDBMS,例如MySQL Cluster
3 - 使用具有主/从拓扑的 NoSQL,支持临时查询和聚合查询,例如Mongo
至于第二个问题:是的,你可以依靠M/R来代替AF。您几乎可以用 M/R 做任何事情。
| 归档时间: |
|
| 查看次数: |
834 次 |
| 最近记录: |