我正在将所有日志从Google Cloud HTTP Loadbalancer导出到BigQuery,但缺少自定义 http 标头,例如X-Forwarded-For来自Cloudflare的原始 ip 。
我在Stackdriver日志记录中也没有看到这些标头,因此这可能不是接收器导出到BigQuery的问题。
我在哪里启用此日志记录?
谢谢
cloudflare google-bigquery google-cloud-platform stackdriver
我正在尝试监控 Google Cloud Platform 上的 Nvidia GPU 计算/内存使用情况。
默认情况下可以在 GCP Web 控制台上监控 CPU 使用情况,但我需要 Stackdriver 代理来监控 RAM 使用情况(据我所知)。
我的计算引擎实例具有(抢占式)GPU。
我可以通过运行nvidia-smi命令来获取当前的 GPU 使用情况,但我不知道如何让 stackdriver 了解这些指标。
monitoring gpu google-cloud-platform stackdriver google-cloud-stackdriver
这里有任何更新 有什么方法可以接收针对 Microsoft Teams 的 Google Stackdriver 警报政策吗?
我尝试通过 Stackdriver 中的“静态 Webhook”选项并在 Teams 中使用 Webhook 传入连接器,但这不起作用。这还是不兼容吗?或者有任何其他方法可以使其在团队频道中发挥作用。我已经知道“stackdriver 的传出 Webhook 和传入 Webhooks 连接器不兼容,因为它们使用不同的格式,并且在 microsoft 团队中聊天/频道没有电子邮件地址(只有用户有)。看起来像在中创建邮件列表Office 365 是迄今为止最好的选择”
我正在 Go 中使用 OpenCensus 将跟踪数据推送到 Stackdriver,以进行涉及 2 个或更多微服务链的调用,我注意到我得到的许多跟踪仅包含某些服务的范围,而不包含整个端到端调用。
目前,我将此归因于以下事实:并非所有调用都被跟踪(仅跟踪某个样本),并且每个服务决定是否跟踪其当前范围。
这是它的工作方式吗?有没有什么方法可以确保调用链中的所有服务在对跟踪进行采样时都这样做?
go google-cloud-trace stackdriver distributed-tracing opencensus
我有一个 gke 集群,其中一些工作负载可能会出现启动问题。当工作负载遇到问题时是否可以创建 stackdriver 通知。
例如:当 CrashLoopBackOff 被触发、Pod 不可调度或工作负载状态在 5 分钟内处于非正常状态时,创建一个事件。
我刚刚开始在 Google Cloud Dataflow 上使用 Apache Beam。我有一个使用计费帐户设置的项目。我计划使用该项目的唯一目的是: 1. 数据流 - 用于所有数据处理 2. pubsub - 用于导出 Stackdriver 日志以供 Datadog 使用
现在,当我写这篇文章时,我当前没有运行任何数据流作业。
回顾过去一个月,我发现数据流成本约为 15 美元,Stackdriver Monitor API 成本约为 18 美元。看起来 Stackdriver Monitor API 的固定价格接近 1.46 美元/天。
我很好奇如何减轻这种情况。我不认为我想要或不需要 Stackdriver Monitoring。是强制性的吗?此外,虽然我觉得我没有运行任何东西,但在过去的一个小时里我看到了这一点:
所以我想问题是这些: 1. 这些调用是什么?2. 是否可以禁用数据流的 Stackdriver 监控或以其他方式降低成本?
google-cloud-platform google-cloud-dataflow stackdriver google-cloud-stackdriver
我试过
jsonPayload.elapsed_ms > 5000
Run Code Online (Sandbox Code Playgroud)
我显然得到了字符“5”的字典顺序比较,因为我只看到“6”、“7”、“8”、“9”的结果(参见“200”之后每行的最终数字) :
我试过
double(jsonPayload.elapsed_ms)>5000
Run Code Online (Sandbox Code Playgroud)
也是如此,但似乎不是正确的语法。
这里有一整节关于转换的内容,但没有示例。
google-cloud-platform google-cloud-logging stackdriver google-cloud-stackdriver
.netcore 应用程序的默认日志条目将写入 stdout 并由 GCP Stackdriver 解释为信息消息,即使它是一个error。有没有办法将 .netcore 错误写入 stderr 或以某种方式配置它们,以便 Stackdriver 将它们解释为错误?
部署具有完整API访问权限并安装Stackdriver代理的全新Google Compute Engine实例后,Monitoring不显示代理的任何指标.
根据" 安装代理"手册,不需要进一步设置(例如手动配置API密钥).
代理服务状态还显示以下错误:
$ systemctl status stackdriver-agent
Jul 13 10:14:00 host stackdriver-agent[21203]: [ OK ]
Jul 13 10:14:00 host systemd[1]: Started LSB: start and stop Stackdriver Agent.
Jul 13 10:14:00 host collectd[21226]: Initialization complete, entering read-loop.
Jul 13 10:14:00 host collectd[21226]: match_throttle_metadata_keys: 1 history entries, 1 distinct keys, 46 bytes server memory.
Jul 13 10:14:00 host collectd[21226]: tcpconns plugin: Reading from netlink succeeded. Will use the netlink method from now on.
Jul 13 10:14:00 host collectd[21226]: …Run Code Online (Sandbox Code Playgroud) 我正在使用Stackdriver Monitoring API来获取与容器相关的指标。从API返回的JSON对象具有以下容器详细信息。
例:
{
"metric": {
"type": "container.googleapis.com/container/cpu/utilization"
},
"resource": {
"type": "gke_container",
"labels": {
"zone": "us-central1-a",
"pod_id": "1138528c-c36e-11e9-a1a7-42010a800198",
"project_id": "auto-scaling-springboot",
"cluster_name": "load-test",
"container_name": "",
"namespace_id": "f0965889-c36d-11e9-9e00-42010a800198",
"instance_id": "3962380509873542383"
}
},
"metricKind": "GAUGE",
"valueType": "DOUBLE",
"points": [
{
"interval": {
"startTime": "2019-09-04T04:00:00Z",
"endTime": "2019-09-04T04:00:00Z"
},
"value": {
"doubleValue": 0.050707947222229495
}
}
]
}
Run Code Online (Sandbox Code Playgroud)
当执行时kubectl describe pod [pod name],我没有得到容器独有的这些信息。因此,我无法识别与容器相对应的结果。
因此,如何获取吊舱ID,以便能够识别它?
stackdriver ×10
monitoring ×3
.net-core ×1
cloudflare ×1
go ×1
gpu ×1
kubernetes ×1
logging ×1
opencensus ×1