标签: kubernetes-health-check

apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: grafana
spec:
  replicas: 1
  template:
    metadata:
      labels:
        name: grafana
    spec:
      initContainers:
        …                                
      containers:
        - name: grafana
          image: grafana/grafana
          readinessProbe:
            httpGet:
              path: /login
              port: 3000
          …

Run Code Online (Sandbox Code Playgroud)

服务:

apiVersion: v1
kind: Service
metadata:
  name: grafana
spec:
  selector:
    name: grafana
  ports:
    - protocol: TCP
      port: 3000
  type: NodePort

Run Code Online (Sandbox Code Playgroud)

Ingress:

apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: grafana
spec:
  tls:
    - secretName: grafana.example.com
  backend:
    serviceName: grafana
    servicePort: 3000

Run Code Online (Sandbox Code Playgroud)

事实证明,grafana服务于302,/但默认的GCE入口健康检查预计200 / …

google-compute-engine kubernetes kubernetes-health-check

mmo*_*oya

2018 05-09

13
推荐指数

2
解决办法

6388
查看次数

initialDelaySeconds的默认值是什么

可以使用此初始延迟来配置Kubernetes的pods(部署)的活跃度和准备状态 - 意味着在容器启动后的许多发送之后,prob将开始.如果未指定,默认值是多少？我似乎找不到它.periodSeconds的默认值记录为10秒.

谢谢

kubernetes kubernetes-health-check

Rya*_*ing

lucky-day

12
推荐指数

2
解决办法

3813
查看次数

使用秘密的httpHeaders定义livenessProbe

我想用一个值为secret的httpHeader定义一个livenessProbe.

此语法无效:

livenessProbe:
  httpGet:
    path: /healthz
    port: 8080
    httpHeaders:
      - name: X-Custom-Header
        valueFrom:
          secretKeyRef:
            name: my-secret-key
            value: secret

Run Code Online (Sandbox Code Playgroud)

如果我将my-secret-keyvalue 指定secret为名为的环境变量MY_SECRET_KEY,则以下内容可以起作用:

livenessProbe:
  exec:
    command:
      - curl
      - --fail
      - -H
      - "X-Custom-Header: $MY_SECRET_KEY"
      - 'http://localhost:8080/healthz'

Run Code Online (Sandbox Code Playgroud)

不幸的是,它不是由于评估报价的方式.如果我curl --fail -H "X-Custom-Header: $MY_SECRET_KEY" http://localhost:8080/healthz直接在容器上键入命令,它就可以工作.

我也试过很多单引号组合并转义双引号.

有没有人知道一个解决方法？

kubernetes kubernetes-health-check

Jen*_*ica

lucky-day

11
推荐指数

1
解决办法

957
查看次数

Health Checks应该调用其他App Health Checks

我有两个我控制的API A和B,都有准备和生活健康检查.A依赖于B.

A
/foo - This endpoint makes a call to /bar in B
/status/live
/status/ready

B
/bar
/status/live
/status/ready

Run Code Online (Sandbox Code Playgroud)

A的准备情况运行状况检查是否应该因为依赖性而调用API B的就绪状况检查？

url api-design health-monitoring kubernetes kubernetes-health-check

Muh*_*eed

lucky-day

10
推荐指数

2
解决办法

501
查看次数

当 HEALTHCHECK 失败时 Docker 容器会发生什么

docker文档说明了什么HEALTHCHECK是指令以及如何检查容器的运行状况。但我无法弄清楚健康检查失败时会发生什么。就像按照用户指令重新启动或停止容器或这两者中的任何一个一样。

另外引用的例子是：
HEALTHCHECK --interval=5m --timeout=3s CMD curl -f http://localhost/ || exit 1

是exit 1关于什么的？

docker dockerfile kubernetes-health-check health-check

sam*_*ers

lucky-day

10
推荐指数

2
解决办法

7562
查看次数

就绪探测失败：获取 http://10.32.1.71:80/setting s: net/http: 请求已取消（等待标头时超出 Client.Timeout）

我的配置是 Kubernetes 上的 Jenkins，项目是用 PHP 编写的。

这里的问题是 pod 连接到入口（而不是使用 GCE 的 loadBalancer），并且当 pod 不健康时，它不会添加它。

我第一次从 0 加载项目时，它在我更新后工作，但由于它不健康而失败。

当我描述 pod 时，我收到以下警告：

就绪探测失败：获取http://10.32.1.71:80/setting s: net/http: 请求已取消（等待标头时超出 Client.Timeout）

我的生产配置：

# Configuration for the SQL connection 
kind: Deployment
apiVersion: extensions/v1beta1
metadata:
  name: wobbl-main-backend-production
spec:
  replicas: 1
  template:
    metadata:
      name: backend
      labels:
        app: wobbl-main
        role: backend
        env: production
    spec:
      containers:
        - name: backend
          image: gcr.io/cloud-solutions-images/wobbl-mobile-backend:1.0.0
          resources:
            limits:
              memory: "500Mi"
              cpu: "100m"
          imagePullPolicy: Always
          readinessProbe:
            httpGet: # make an HTTP request
              port: 80 # port …

Run Code Online (Sandbox Code Playgroud)

google-compute-engine kubernetes google-kubernetes-engine kubernetes-health-check

DaA*_*dza

lucky-day

8
推荐指数

1
解决办法

2万
查看次数

Kubernetes 健康检查：timeoutSeconds 超过 periodSeconds

在 Kubernetes 中Kubernetes Health Check Probes，如果timeoutSeconds超过会发生什么periodSeconds？例如：

initialDelaySeconds: 10
periodSeconds: 5
timeoutSeconds: 10
successThreshold: 1
failureThreshold: 3

Run Code Online (Sandbox Code Playgroud)

Pod 什么时候会“失败”？

initialDelaySeconds+ ( periodSeconds* failureThreshold); 或者
initialDelaySeconds+ ( MAX( periodSeconds, timeoutSeconds) * failureThreshold);

当 Pod 成功时，同样的问题也适用。

kubernetes kubernetes-health-check readinessprobe livenessprobe

h q*_*h q

lucky-day

8
推荐指数

1
解决办法

3836
查看次数