分布式缓存和Tachyon有什么区别？

Question

分布式缓存是一种存储常见请求并支持快速检索的方法.

Tachyon是一个以内存为中心的分布式存储文件系统,可避免进入磁盘以加载经常读取的数据集.

这两者有什么不同？

Answer 1

主要区别在于编程范例,请注意,根据您的定义,Tachyon几乎肯定是分布式缓存.

大多数分布式缓存通常是某种形式的键值存储,而更高级别的数据结构可以在此基础上构建,核心范例往往是关键值.

Tachyon旨在用作与大数据分析领域中普遍存在的HDFS接口兼容的软件文件系统.这样做的关键是它可以用作加速器的下拉,而不是必须调整每个框架以明确地使用分布式缓存层.

请注意,Apache Ignite和Apache Geode(Incubating)都是相关项目,它们提供键值和文件系统样式API,使它们更具灵活性.

Answer 2

Tachyon（现在称为Alluxio）位于计算层（Apache Spark，Apache Flink，Apache MapReduce）和存储层（HDFS，Amazon S3，OpenStack Swift等）之间。

它基本上是一个内存中文件系统，用于从下面（一个或多个）存储系统中抽象出用户。

对于上面的计算框架或工作，Tachyon是数据存储区，用于保存要计算的数据。

它无法执行分布式计算的高级功能，并且无法像某些分布式缓存一样（Apache Ignite或Hazelcast）提供SQL查询支持。