我是 Hadoop 和 HDFS 的新手,我很困惑为什么 HDFS 不是需要低延迟的应用程序的首选。在大数据场景中,我们会将数据分布在不同的社区硬件上,因此访问数据应该更快。
hadoop hdfs apache-spark hawq
apache-spark ×1
hadoop ×1
hawq ×1
hdfs ×1