使用 AWS CloudWatch 监控 EC2 Windows 实例的服务

pru*_*hvi 3 monitoring amazon-ec2 amazon-web-services amazon-cloudwatch

我使用 CloudWatch 自定义指标监控了性能计数器,例如内存、可用磁盘等。我可以使用 CloudWatch 监控服务吗?我检查了 cloud watch 监控的功能,但没有发现与监控服务相关的内容。我只需要监控服务是否正在运行,并在服务状态发生变化时发送通知。

Ant*_*ace 5

是的,但是像您提到的EC2Config Windows 集成这样的开箱即用解决方案对于服务级别的自定义指标并不那么容易获得。

CloudWatch 自定义指标允许您使用自己定义的指标和数据扩展 CloudWatch,因此您可以合理地自行实施它们以监控您自己的服务。您的服务可以将指标数据写入 CloudWatch 本身,或者您可以编写另一个流程来监控您的服务并根据您的服务对 CloudWatch 的响应写入指标。


根据您的编辑,为任意一组 Windows 服务发布 CloudWatch 自定义指标将需要一些特定于 Windows 的 powershell,因为我们不能假设该服务将有一个 Web 端点可以 ping。

您需要创建一个服务监视器,通过 评估您的服务Get-Service,然后将数据点发布到 CloudWatch 自定义指标(如果它们正在运行)。

这是 PowerShell 中的一个示例实现,它将为名称*YOURSERVICENAMESHERE*每 300 秒匹配一次的服务编写自定义指标。如果您想为EC2 实例上的每个服务运行它,您可以将其替换为通配符*,但这在规模上可能会很昂贵。如果盒子上有太多服务,它可能还需要一些调整,因为您一次只能通过Write-CwMetricData. 有关详细信息,请参阅代码注释。

通过仅在成功时创建数据点,您可以建立一个“失败”条件(X 秒的 INSUFFICIENT_DATA),您可以使用它来创建满足通知约束的 CloudWatch 警报。

此脚本必须在安装和配置了适用于 PowerShell 的 AWS 工具的 Windows EC2 实例上运行:

Param
(
    [string]$Period = 300,
    [string]$Namespace = 'service-monitor'
)

# Use the EC2 metadata service to get the host EC2 instance's ID
$instanceId = (New-Object System.Net.WebClient).DownloadString("http://169.254.169.254/latest/meta-data/instance-id")

# Associate current EC2 instance with your custom cloudwatch metric
$instanceDimension = New-Object -TypeName Amazon.CloudWatch.Model.Dimension;
$instanceDimension.Name = "instanceid";
$instanceDimension.Value = $instanceId;

# "Job" loop; write to CloudWatch and then sleep for the interval defined by the period variable above, in seconds.
while($true)
{
    $metrics = @();

    $runningServices = Get-Service -Name *YOURSERVICENAMESHERE* | ? { $_.Status -eq 'Running' }

    # For each running service, add a metric to metrics collection that adds a data point to a CloudWatch Metric named 'Status' with dimensions: instanceid, servicename
    $runningServices | % { 
        $dimensions = @();

        $serviceDimension = New-Object -TypeName Amazon.CloudWatch.Model.Dimension;
        $serviceDimension.Name = "service"
        $serviceDimension.Value = $_.Name;

        $dimensions += $instanceDimension;
        $dimensions += $serviceDimension;

        $metric = New-Object -TypeName Amazon.CloudWatch.Model.MetricDatum;
        $metric.Timestamp = [DateTime]::UtcNow;
        $metric.MetricName = 'Status';
        $metric.Value = 1;
        $metric.Dimensions = $dimensions;

        $metrics += $metric;       

        Write-Host "Checking status for: $($_.Name)"        
    }

    # Write all of the metrics for this run of the job at once, to save on costs for calling the CloudWatch API.
    # This will fail if there are too many services in metrics collection; if this happens, just reduce the amount of
    # services monitored, or edit this line into the above foreach loop and write each metric directly.
    Write-CWMetricData -Namespace $Namespace -MetricData $metrics

    Write-Host "Sleeping for $Period seconds."

    Start-Sleep -s $Period
}
Run Code Online (Sandbox Code Playgroud)

将其保存到文件中,您可以从命令行运行它以开始编写指标。一旦您对它感到满意,就可以随意放弃计划任务或 powershell 作业的“while true”循环。

其他资源: