小编Nos*_*osk的帖子

MapReduce还是Spark?

我用cloudera测试了hadoop和mapreduce,我发现它非常酷,我认为我是最新的相关BigData解决方案.但是几天前,我发现了这个:https: //spark.incubator.apache.org/

一个"闪电快速集群计算系统",能够在Hadoop集群的顶部工作,并且显然能够破坏mapreduce.我看到它在RAM中比mapreduce更有效.我认为当你必须进行集群计算来克服单个机器上的I/O问题时,mapreduce仍然是相关的.但是,由于Spark可以完成mapreduce所做的工作,并且可能在几个操作上更有效率,它不是MapReduce的结束吗?或者MapReduce可以做些什么,或者MapReduce在特定环境中比Spark更有效?

hadoop mapreduce bigdata apache-spark

26
推荐指数
2
解决办法
2万
查看次数

Impala无法访问所有配置单元表

我尝试通过hive查询hbase数据(我正在使用cloudera).我做了一个指向hbase的fiew hive外部表,但事情是Cloudera的Impala无法访问所有这些表.所有hive外部表都出现在Metastore管理器中,但是当我在Impala中执行一个简单的"show tables"时,我看到缺少3个表.这会是特权问题吗?我看到在Metastore管理器中,每个人都可以读取丢失的3个表,所以......

hadoop hive cloudera hue impala

20
推荐指数
1
解决办法
2万
查看次数

标签 统计

hadoop ×2

apache-spark ×1

bigdata ×1

cloudera ×1

hive ×1

hue ×1

impala ×1

mapreduce ×1