无法使用 FQDN 通过无头服务访问 statefulset pod

nit*_*h99 5 dns kubernetes kubernetes-ingress kubernetes-pod

我有一个 k8 设置,看起来像这样

ingress -> headless service (k8 service with clusterIp: none) -> statefulsets ( 2pods)

Fqdn 看起来像这样:

nslookup my-service
Server:         100.4.0.10
Address:        100.4.0.10#53

Name:   my-service.my-namespace.svc.cluster.local
Address: 100.2.2.8
Name:   my-service.my-namespace.svc.cluster.local
Address: 100.1.4.2
Run Code Online (Sandbox Code Playgroud)

我尝试使用以下 FQDN 通过服务直接访问其中一个 Pod,但无法这样做。

curl -I my-pod-0.my-service.my-namespace.svc.cluster.local:8222
curl: (6) Could not resolve host: my-pod-0.my-service.my-namespace.svc.cluster.local
Run Code Online (Sandbox Code Playgroud)

如果我尝试直接访问该服务,那么它可以正常工作(作为负载平衡器)

curl -I my-service.my-namespace.svc.cluster.local:8222
HTTP/1.1 200 OK
Date: Sat, 31 Jul 2021 21:24:42 GMT
Content-Length: 656
Run Code Online (Sandbox Code Playgroud)

如果我尝试使用 pod 的集群 IP 直接访问它,它也可以正常工作

curl -I 100.2.2.8:8222
HTTP/1.1 200 OK
Date: Sat, 31 Jul 2021 21:29:22 GMT
Content-Length: 656
Content-Type: text/html; charset=utf-8
Run Code Online (Sandbox Code Playgroud)

但我的用例要求我能够使用 fqdn ie 访问 statefulset pod my-pod-0.my-service.my-namespace.svc.cluster.local。我在这里缺少什么?

P..*_*... 1

foo使用 image调用的状态集示例nginx

k get statefulsets.apps
NAME   READY   AGE
foo    3/3     8m55s
Run Code Online (Sandbox Code Playgroud)

该有状态集创建了以下 pod( foo-0,foo-1,foo-2):

k get pod -o wide
NAME      READY   STATUS    RESTARTS   AGE     IP             NODE        NOMINATED NODE   READINESS GATES
busybox   1/1     Running   1          3h47m   10.1.198.71    ps-master   <none>           <none>
foo-0     1/1     Running   0          12m     10.1.198.121   ps-master   <none>           <none>
foo-1     1/1     Running   0          12m     10.1.198.77    ps-master   <none>           <none>
foo-2     1/1     Running   0          12m     10.1.198.111   ps-master   <none>           <none>
Run Code Online (Sandbox Code Playgroud)

现在创建一个无头服务(clusterIP is none)如下:(确保使用与您的有状态集相同的正确选择器)

apiVersion: v1
kind: Service
metadata:
  name: nginx
  labels:
    app: foo
spec:
  type: ClusterIP
  clusterIP: None
  ports:
  - port: 80
    name: web
  selector:
    app: foo
Run Code Online (Sandbox Code Playgroud)

现在,nslookup查看dns适用于该服务的解决方案。(可选步骤)

k exec -it busybox -- nslookup nginx.default.svc.cluster.local
Server:    10.152.183.10
Address 1: 10.152.183.10 kube-dns.kube-system.svc.cluster.local

Name:      nginx.default.svc.cluster.local
Address 1: 10.1.198.77 foo-1.nginx.default.svc.cluster.local
Address 2: 10.1.198.111 foo-2.nginx.default.svc.cluster.local
Address 3: 10.1.198.121 foo-0.nginx.default.svc.cluster.local
Run Code Online (Sandbox Code Playgroud)

现在验证每个 Pod 的单独分辨率是否正常工作:

k exec -it busybox -- nslookup foo-1.nginx.default.svc.cluster.local
Server:    10.152.183.10
Address 1: 10.152.183.10 kube-dns.kube-system.svc.cluster.local

Name:      foo-1.nginx.default.svc.cluster.local
Address 1: 10.1.198.77 foo-1.nginx.default.svc.cluster.local
Run Code Online (Sandbox Code Playgroud)

更多信息:这里

注意:在这种情况下,OP 的headless服务和 的映射不正确statefulset,可以使用以下命令进行验证:

k get statefulsets.apps foo -o jsonpath="{.spec.serviceName}{'\n'}"
nignx
Run Code Online (Sandbox Code Playgroud)

确保映射。

  • 我发现了这个问题..看起来我的 statefulset 中的 serviceName 属性是错误的。一旦我更正它,我就能够使用 Pod 名称进行解析。我会接受您的答案,但您能否在答案中突出显示此信息,以确保将来有人不会再犯同样的错误。 (2认同)