DataDog 中的计数和计量指标类型有什么区别?

Bas*_*hur 17 datadog

DataDog 中的计数计量指标类型有什么区别?或者更确切地说,我什么时候应该选择其中一种而不是另一种?他们网站上的定义对我没有多大帮助:

\n

数数:

\n
\n

COUNT 指标提交类型表示一个时间间隔内事件发生的总数。COUNT 可用于跟踪对数据库进行的连接总数或对端点的请求总数。这个事件数量可以随着时间的推移而累积或减少\xe2\x80\x94它不是单调增加的。

\n
\n

测量:

\n
\n

GAUGE 指标提交类型表示一个时间间隔内事件的快照。该代表性快照值是在某个时间间隔内提交给代理的最后一个值。GAUGE 可用于测量连续\xe2\x80\x94 报告的内容,例如可用磁盘空间或使用的内存。

\n
\n

类型count似乎与类型有些相关rate,但对我来说,不清楚为什么或何时应该使用count而不是gauge. 我的意思是,原则上“某物”的测量总是可以作为量规呈现,不是吗?

\n

小智 15

datadog文档给出了关于它们差异的清晰示例:

\n
数数
\n
\n

假设您从运行 Datadog Agent 的单个主机提交 COUNT 个指标 activeusers.basket_size。该主机在刷新时间间隔内发出以下值:[1,1,1,2,2,2,3,3]。

\n

代理将在一个时间间隔内收到的所有值相加,并提交总数(在本例中为 15)作为 COUNT 指标\xe2\x80\x99s 值。

\n
\n
测量
\n
\n

假设您从运行 Datadog Agent 的单个主机提交 GAUGE 指标(温度)。该主机在刷新时间间隔内发出以下值:[71,71,71,71,71,71,71.5]。

\n

代理提交最后报告的数字(在本例中为 71.5)作为 GAUGE metric\xe2\x80\x99s 值。

\n
\n

本质上,在一个刷新时间间隔内,通常是10s,Count 累加所有值并提交总和值,而 Gauge 只保留最新的一个,因为它是快照,而且消耗的资源也较少。

\n

Count 的一个很好的例子是,我们想知道在某个时间段内发生了多少 404,在这种情况下,总和很重要。Gauge 的一个很好的例子是,我们想要检查一台服务器的内存使用情况,默认刷新间隔 10 秒足以获取有关它的一个特定快照。

\n