无法从 https://kubernetes.default 得到响应

Ant*_*ver 1 kubernetes

我有一个最近升级的集群。从那时起,集群中运行的所有 pod 都无法从https://kubernetes.default/healthz获得响应。

需要明确的是,他们可以解析URL,但它不断超时,连接被拒绝。

我已经验证 api-server 正在运行,因为我可以从http://localhost:8080/healthz获得响应,但我无法从 pod 中获得任何信息。

我检查了所有脚本和配置,并将它们与同时升级的其他集群进行了比较,似乎没有什么不同。

我确定这是我忽略的小东西,但我不知道还能在哪里看。

附加信息:

  • 设置是与 kops
  • 在 AWS 中运行(不是托管服务,而是原始服务)
  • 上述查询在其他集群中按预期工作
  • 升级是从 1.11 到 1.13(是的,我知道这是不赞成的。至少现在我这样做了。)
  • 其他集群有相同的升级路径

[编辑]

提供/etc/resolv.conf

cat /etc/resolv.conf
nameserver 100.64.0.10
search jenkins.svc.cluster.local svc.cluster.local cluster.local us-west-2.compute.internal
options ndots:5
Run Code Online (Sandbox Code Playgroud)

Rod*_*oza 5

检查我上传的图像,您只能从命名空间中的 pod 中解析dns 。对于其他命名空间,请在以下 curl 中使用。您也已经在 pod 中安装了证书和令牌。kubernetesdefaultkubernetes.default.svc

curl --cacert /var/run/secrets/kubernetes.io/serviceaccount/ca.crt -H "Authorization: Bearer $(cat /var/run/secrets/kubernetes.io/serviceaccount/token)" -H "Accept: application/json" https://kubernetes.default.svc/api/

图片