与apache cassandra一起使用的最佳数据存储文件系统?

DTo*_*odt 2 distributed-cache cassandra cloud-storage

我想知道在哪里存储cassandra提供的数据.像"数据湖"这样的东西,在那里我可以把所有处理过的数据,在一天结束时或类似的东西.

我正在寻找一种可以防止数据丢失的分布式可靠存储解决方案.

Cassandra的文件系统名为CFS,但在哪里存储?

小智 7

Cassandra以其实时异步复制的形式构建了弹性.在大多数情况下,在EXT4,ZFS等之外使用任何类型的特殊文件系统都可能导致Cassandra世界出现问题.

大多数用户依赖于Cassandra的复制,但有些人还选择合并备份,他们往往会上传到云存储或单独的mnt点.

如果你的意思是你想从Cassandra获取数据并将其存储在其他地方,比如datalake,我建议使用Spark有效地从Cassandra中批量读取数据,然后写出平面文件或你选择的系统.