我想对HDFS中的数据进行一些"近实时"数据分析(类似OLAP). 我的研究表明,与Apache Hive相比,上述三个框架报告了显着的性能提升.有没有人对其中任何一个有一些实际经验?不仅涉及性能,还涉及稳定性?
bigdata impala apache-spark apache-drill
apache-drill ×1
apache-spark ×1
bigdata ×1
impala ×1