设计一个高可用的Kubernetes部署方案 -

题目

设计一个高可用的Kubernetes部署方案

信息

类型：问答
难度：⭐⭐

考点

Kubernetes部署策略,高可用设计,服务发现,健康检查

快速回答

实现高可用Kubernetes部署的核心要点：

使用多副本（ReplicaSet/Deployment）分散Pod到不同节点
配置滚动更新策略（RollingUpdate）保证零停机部署
通过Readiness/Liveness探针实现健康检查
利用Service负载均衡和Endpoint自动发现
结合HPA（Horizontal Pod Autoscaler）应对流量波动

## 解析

1. 核心原理说明

高可用部署的核心是通过冗余和自动故障转移确保服务连续性：

多副本机制：Kubernetes通过ReplicaSet确保指定数量的Pod副本始终运行
自愈能力：当Pod故障时，控制器会自动创建新Pod替代
流量管理：Service通过kube-proxy和Endpoints实现负载均衡和动态路由

2. 部署方案示例

以下是一个完整的Deployment配置示例：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: webapp-ha
spec:
  replicas: 3  # 多副本
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1       # 滚动更新时最大额外Pod数
      maxUnavailable: 0 # 保证始终有可用Pod
  selector:
    matchLabels:
      app: webapp
  template:
    metadata:
      labels:
        app: webapp
    spec:
      affinity:
        podAntiAffinity:  # Pod反亲和性
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: app
                operator: In
                values: [webapp]
            topologyKey: kubernetes.io/hostname
      containers:
      - name: webapp
        image: my-registry/webapp:v1.2.3
        ports:
        - containerPort: 8080
        readinessProbe:   # 就绪探针
          httpGet:
            path: /health
            port: 8080
          initialDelaySeconds: 5
          periodSeconds: 10
        livenessProbe:    # 存活探针
          httpGet:
            path: /health
            port: 8080
          initialDelaySeconds: 15
          periodSeconds: 20
---
apiVersion: v1
kind: Service
metadata:
  name: webapp-service
spec:
  selector:
    app: webapp
  ports:
    - protocol: TCP
      port: 80
      targetPort: 8080
  type: LoadBalancer  # 外部流量入口

3. 关键配置解析

滚动更新策略：maxUnavailable:0确保更新期间始终有可用实例
Pod反亲和性：强制Pod分散在不同节点（hostname），避免单点故障
双探针机制：
- ReadinessProbe：控制Pod何时加入Service流量池
- LivenessProbe：检测应用僵死状态并重启Pod
Service负载均衡：自动将流量路由到健康Pod

4. 最佳实践

副本数量：至少3副本，跨3个可用区（AZ）部署

资源限制：设置requests/limits防止资源争抢

resources:
  requests:
    memory: "128Mi"
    cpu: "100m"
  limits:
    memory: "256Mi"
    cpu: "500m"

HPA自动扩缩：根据CPU/内存或自定义指标自动调整副本数

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: webapp-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: webapp-ha
  minReplicas: 3
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70

5. 常见错误

探针配置不当：
- initialDelaySeconds过短导致频繁重启
- 检查路径未实现或响应慢造成误判
忽略Pod亲和性：所有副本集中在同一节点/AZ
资源限制缺失：引发OOMKilled或节点资源耗尽
版本回滚缺失：未配置rollbackToRevision导致故障无法快速恢复

6. 扩展知识

蓝绿部署：通过两个完全相同的环境切换实现零停机更新

金丝雀发布：使用Service Mesh（如Istio）将部分流量导到新版本

# Istio VirtualService 示例
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
spec:
  hosts: [webapp-service]
  http:
  - route:
    - destination:
        host: webapp-service
        subset: v1
      weight: 90  # 90%流量走旧版
    - destination:
        host: webapp-service
        subset: v2
      weight: 10  # 10%流量走新版

多集群部署：使用Kubernetes Federation实现跨云高可用

设计一个高可用的Kubernetes部署方案

题目

信息

考点

快速回答

1. 核心原理说明

2. 部署方案示例

3. 关键配置解析

4. 最佳实践

5. 常见错误

6. 扩展知识

如何创建一个简单的Nginx Deployment并通过Service暴露访问？

如何创建一个运行Nginx的Kubernetes Pod？

设计一个高可用的Kubernetes部署方案