Google pubsub中的topic / send_message_operation_count和topic / send_request_count有什么区别?
要求是尽管我可以通过undeliver_messages计算订户中存在的消息数,但我需要计算有多少消息被推送到该主题。
谢谢,桑托什
这些不是自定义指标,我只是尝试添加现有的 GCP 指标。
如何在堆栈驱动程序时间序列中添加 2 个指标?
我有两个不同的指标,我想对它们进行求和,这样我就看到一条线——而且我也希望能够针对这个求和指标发出警报。这可能吗?
同样,我不会将指标发送给堆栈驱动程序,而是使用现有的指标来执行此操作。
google-cloud-platform stackdriver google-cloud-monitoring google-cloud-stackdriver
我正在使用Google Cloud Stackdriver,使用类似于以下内容的代码段从GKE进行日志记录:
import google.cloud.logging
logging_client = google.cloud.logging.Client()
# connects the logger to the root logging handler
cloud_logger = logging_client.logger('email_adaptor')
struct = {'message':'Processed Alarm', 'valid': True}
cloud_logger.log_struct(struct, severity='INFO')
Run Code Online (Sandbox Code Playgroud)
我验证了https://cloud.google.com/appengine/articles/deadlineexceedederrors页面以处理DeadlineExceededErrors,但目前尚不清楚是什么原因导致的google.api_core.exceptions.ServiceUnavailable.
过去几天,Stackdriver的状态已在https://status.cloud.google.com/上提供.我每小时得到这样的错误大约12次.
Exception:
Traceback (most recent call last):
File "/usr/local/lib/python3.6/dist-packages/google/api_core/grpc_helpers.py", line 59, in error_remapped_callable
return callable_(*args, **kwargs)
File "/usr/local/lib/python3.6/dist-packages/grpc/_channel.py", line 533, in __call__
return _end_unary_response_blocking(state, call, False, None)
File "/usr/local/lib/python3.6/dist-packages/grpc/_channel.py", line 467, in _end_unary_response_blocking
raise _Rendezvous(state, None, None, deadline)
grpc._channel._Rendezvous: <_Rendezvous of RPC that terminated with: …Run Code Online (Sandbox Code Playgroud) python logging kubernetes stackdriver google-cloud-stackdriver
目标:从内部版本为1.11.2的Kuberntes HA群集中获取有关Google Stackdriver的日志记录/监视信息。
我已经能够使用Fluentd Daemonset for Kubernetes将日志发送到Elasticsearch ,但是该项目不支持Stackdriver(问题)。就是说,有一个为Stackdriver(source)创建的docker镜像,但是没有daemonset。查看此存储库中的其他守护程序集,不同的fluent.conf文件之间有相似之处,除了fluent.conf缺少任何环境变量的Stackdriver 文件。
如 上面提到的GitHub问题所述,此处的Kubernetes GitHub中有一个插件 ,但这是旧版。这些文档可以在这里找到 。
它指出:
“警告:除了Google Kubernetes Engine以外,Stackdriver日志记录守护程序在其他平台上都存在已知问题。请您自担风险。”
以这种方式安装失败,没有说明原因。
其他一些注意事项。有Stackdriver Kubernetes Monitoring明确指出:
“易于在任何云或本地上入门”
在首页上,但似乎没有解释如何做。这个Stack Overflow问题 中有人希望将监视添加到他的AWS集群中。似乎尚不支持。
此外,在实际的Google Stackdriver上还指出
“与多个云和本地基础结构一起使用”。
值得注意的是,我是Fluentd和Google Cloud Platform的新手,但对管理本地Kubernetes集群非常熟悉。
有没有人能够从另一个平台上进行监视或登录以在GCP上工作?如果是这样,使用了什么方法?
我正在将所有日志从Google Cloud HTTP Loadbalancer导出到BigQuery,但缺少自定义 http 标头,例如X-Forwarded-For来自Cloudflare的原始 ip 。
我在Stackdriver日志记录中也没有看到这些标头,因此这可能不是接收器导出到BigQuery的问题。
我在哪里启用此日志记录?
谢谢
cloudflare google-bigquery google-cloud-platform stackdriver
我正在重新使用 gcloud cli 将事件发送到 StackDriver 错误报告。
(非常有限的)文档在这里:https : //cloud.google.com/sdk/gcloud/reference/beta/error-reporting/events/report
无论我作为消息发送什么,我似乎都会收到此错误:
错误:(gcloud.beta.error-reporting.events.report) INVALID_ARGUMENT:ReportedErrorEvent.context 必须包含一个位置,除非
message包含异常或堆栈跟踪。
我尝试将消息格式化为错误报告的 JSON 表示:https : //cloud.google.com/error-reporting/docs/formatting-error-messages 但消息似乎相同。这是一个示例命令和 JSON:
gcloud beta error-reporting events report --service foo --message-file err.json
{
"serviceContext": {
"service": "foo"
},
"message": "Whoops!",
"context": {
"reportLocation": {
"filePath": "/usr/local/bin/test",
"lineNumber": 123,
"functionName": "main"
}
}
}
Run Code Online (Sandbox Code Playgroud) google-cloud-platform gcloud stackdriver google-cloud-stackdriver google-cloud-error-reporting
我正在尝试监控 Google Cloud Platform 上的 Nvidia GPU 计算/内存使用情况。
默认情况下可以在 GCP Web 控制台上监控 CPU 使用情况,但我需要 Stackdriver 代理来监控 RAM 使用情况(据我所知)。
我的计算引擎实例具有(抢占式)GPU。
我可以通过运行nvidia-smi命令来获取当前的 GPU 使用情况,但我不知道如何让 stackdriver 了解这些指标。
monitoring gpu google-cloud-platform stackdriver google-cloud-stackdriver
这里有任何更新 有什么方法可以接收针对 Microsoft Teams 的 Google Stackdriver 警报政策吗?
我尝试通过 Stackdriver 中的“静态 Webhook”选项并在 Teams 中使用 Webhook 传入连接器,但这不起作用。这还是不兼容吗?或者有任何其他方法可以使其在团队频道中发挥作用。我已经知道“stackdriver 的传出 Webhook 和传入 Webhooks 连接器不兼容,因为它们使用不同的格式,并且在 microsoft 团队中聊天/频道没有电子邮件地址(只有用户有)。看起来像在中创建邮件列表Office 365 是迄今为止最好的选择”
我正在 Go 中使用 OpenCensus 将跟踪数据推送到 Stackdriver,以进行涉及 2 个或更多微服务链的调用,我注意到我得到的许多跟踪仅包含某些服务的范围,而不包含整个端到端调用。
目前,我将此归因于以下事实:并非所有调用都被跟踪(仅跟踪某个样本),并且每个服务决定是否跟踪其当前范围。
这是它的工作方式吗?有没有什么方法可以确保调用链中的所有服务在对跟踪进行采样时都这样做?
go google-cloud-trace stackdriver distributed-tracing opencensus
我试过
jsonPayload.elapsed_ms > 5000
Run Code Online (Sandbox Code Playgroud)
我显然得到了字符“5”的字典顺序比较,因为我只看到“6”、“7”、“8”、“9”的结果(参见“200”之后每行的最终数字) :
我试过
double(jsonPayload.elapsed_ms)>5000
Run Code Online (Sandbox Code Playgroud)
也是如此,但似乎不是正确的语法。
这里有一整节关于转换的内容,但没有示例。
google-cloud-platform google-cloud-logging stackdriver google-cloud-stackdriver
stackdriver ×10
kubernetes ×2
cloudflare ×1
fluentd ×1
gcloud ×1
go ×1
google-cloud-error-reporting ×1
gpu ×1
logging ×1
monitoring ×1
opencensus ×1
python ×1