Grafana 快照 - 所需的数据是从源存储还是获取?

rab*_*ens 2 grafana

我们想使用 Grafana 来显示测量数据。现在,我们的测量设置创建了大量数据并保存在文件中。我们按原样保留文件,并直接使用 Spark(“数据湖”方法)对它们进行后处理。

我们现在想要创建一些可视化,我想在运行 Spark 和 HDFS(存储文件的位置)的集群上设置 Cassandra。将有一个服务(或 Spark-Streaming 作业)将选定的通道从测量数据文件转储到 Kafka 主题,另一个作业将它们放入 Cassandra 中。我使用这种方法是因为我们还有其他流处理作业也可以进行即时计算。

我现在考虑编写一个小型 REST 服务,使 Grafana 的简单 JSON 数据源可用于提取数据并将其可视化。到目前为止一切都很好,但由于我们收集的数据量很大(有时每分钟大约 300MiB),Cassandra 数据库应该只保存最近几个小时的数据。

我现在的问题是:如果有人查看数据,发现一些有趣的东西并创建仪表板或面板的快照(或发生某个事件并自动拍摄快照),并且原始数据从 Cassandra 中删除,快照是否可以还可以查看吗?数据是一起保存的吗?还是快照只保存元数据,重新查询数据源?

Yur*_*hin 5

根据 Grafana 文档

仪表板快照 仪表板快照是公开共享交互式仪表板的即时方式。创建后,我们会删除查询(指标、模板和注释)和面板链接等敏感数据,只留下嵌入到仪表板中的可见指标数据和系列名称。任何知道链接并可以访问 URL 的人都可以访问仪表板快照。

因此,数据保存在快照内,不再依赖于原始数据。据我了解Local Snapshot存储在grafana db中。在您的数据规模下,使用外部存储(webdav 等)进行快照可能是更好的选择。