Sac*_*hin 5 storage distributed hadoop distributed-system hdfs
我有一个奇怪的问题。
什么是hadoop的一些分布式和可扩展的替代方案。我正在寻找像HDFS这样的分布式文件系统,该系统可以用作廉价而有效的存储,并希望在其之上具有数据处理引擎(批处理/实时)。我知道Spark可以是一个很好的选择。但是我想将此系统用作分布式,容错和可扩展的文件存档。是否有合适的解决方案?欢迎提出建议。谢谢 :)
这些是 Hadoop 和 Apache Spark 的其他一些替代方案。Cluster Map Reduce、Hydra 和Conclusion,对于大数据项目来说都是比较好的。在这里阅读更多 https://datafloq.com/read/Big-Data-Hadoop-Alternatives/1135