在AWS EKS中利用RabbitMQ事件驱动Chef实现MariaDB Galera集群的自动化配置

云原生与DevOps

文章字数: 2.9k

阅读时长: 12 分

我们的生产环境背负着一个沉重的历史包袱：一套高度稳定的MariaDB Galera集群，其复杂的初始化、成员变更和配置管理逻辑，完全固化在数千行的Chef Cookbooks中。现在，团队的目标是将所有有状态服务迁移到AWS EKS上。一个直接的、看似合理的方案是在initContainer里执行chef-client来完成节点的配置。我们在测试环境中尝试了，结果是一场灾难。

启动一个新Pod的时间从几十秒飙升到五分钟以上，因为initContainer必须阻塞式地完成整个Chef收敛过程。更糟糕的是，当进行滚动更新或集群扩容时，多个Pod同时启动，它们的initContainer会并发执行Chef，导致Chef Server负载骤增，甚至出现竞态条件和配置错乱。这种紧耦合的设计，将Kubernetes的声明式终态模型与Chef的命令式过程管理生硬地捆绑在一起，脆弱不堪。我们需要一个解耦的、异步的、事件驱动的方案。

核心思路是切断Pod生命周期与Chef执行的直接依赖。Pod启动后，它的首要任务不是配置自己，而是“宣告”自己的存在与待配置状态。真正的配置工作由一个独立的、异步的消费者来触发。RabbitMQ作为我们内部标准的消息总线，自然成为了这个架构的核心。

整个流程被重新设计：

一个MariaDB Pod在EKS中被创建，启动主容器。
容器的入口脚本（Entrypoint）不再执行chef-client，而是执行一个轻量级的注册程序。
该程序收集自身Pod的元数据（如Pod IP、Pod名称、所属StatefulSet等），并将其作为一条消息发布到RabbitMQ的特定交换机（Exchange）。
一个或多个独立的Chef执行器（可以是部署在EKS中的一个Deployment）作为消费者，监听该队列。
当消费者收到消息后，它解析出目标Pod的信息，并远程触发chef-client，应用相应的Cookbook来配置该MariaDB节点，使其加入或初始化Galera集群。

这种架构将重量级的配置过程从关键的Pod启动路径中剥离，极大地提高了Pod的启动速度和系统的弹性。

sequenceDiagram
    participant K8S as Kubernetes API
    participant Pod as MariaDB Pod (StatefulSet)
    participant RabbitMQ
    participant ChefRunner as Chef Runner (Deployment)
    participant ChefServer as Chef Server

    K8S->>Pod: 创建/启动Pod
    activate Pod
    Pod->>Pod: Entrypoint脚本执行
    Pod->>RabbitMQ: 发布"NodeReadyForConfig"事件 (含Pod IP, Name)
    deactivate Pod

    activate RabbitMQ
    RabbitMQ-->>ChefRunner: 路由消息至消费者
    deactivate RabbitMQ

    activate ChefRunner
    ChefRunner->>ChefRunner: 解析消息获取目标Pod信息
    ChefRunner->>ChefServer: 请求Node的Run List和Attributes
    activate ChefServer
    ChefServer-->>ChefRunner: 返回Cookbooks和配置
    deactivate ChefServer
    ChefRunner->>Pod: 远程执行chef-client (e.g. SSH/WinRM or kubectl exec)
    
    activate Pod
    Pod->>Pod: 执行Chef收敛，配置Galera
    Pod-->>ChefRunner: chef-client执行完毕
    deactivate Pod
    
    deactivate ChefRunner

第一步：构建包含Chef客户端的MariaDB镜像

我们需要一个同时包含MariaDB服务和Chef Infra Client的容器镜像。在真实项目中，不建议直接在生产镜像里安装编译工具，但为了演示，这里简化了流程。一个生产级的Dockerfile会采用多阶段构建。

Dockerfile

# 使用官方MariaDB作为基础镜像
FROM mariadb:10.6

# 设置环境变量，避免交互式安装提示
ENV DEBIAN_FRONTEND=noninteractive

# 安装Chef Infra Client所需的依赖
# 在生产环境中，应使用更精简的基础镜像并精确控制安装的包
RUN apt-get update && \
    apt-get install -y --no-install-recommends \
    curl \
    gnupg2 \
    wget \
    build-essential \
    ruby-dev \
    && rm -rf /var/lib/apt/lists/*

# 安装Chef Infra Client
# 这里使用了官方的安装脚本，生产环境建议直接下载deb包进行安装
RUN curl -L https://omnitruck.chef.io/install.sh | bash -s -- -P chef -v 17.10

# 安装RabbitMQ客户端库(bunny)
# 我们的入口脚本需要用它来发消息
RUN /opt/chef/embedded/bin/gem install bunny --no-document

# 复制Chef配置文件、验证密钥和入口脚本
COPY ./chef/client.rb /etc/chef/client.rb
COPY ./chef/validation.pem /etc/chef/validation.pem
COPY ./entrypoint.sh /usr/local/bin/entrypoint.sh

# 赋予入口脚本执行权限
RUN chmod +x /usr/local/bin/entrypoint.sh

# 设置容器的入口点
ENTRYPOINT ["/usr/local/bin/entrypoint.sh"]

# 默认命令，启动MariaDB服务
CMD ["mysqld"]

这里的关键在于，镜像中不仅有mysqld，还有完整的Chef客户端环境 /opt/chef/embedded/bin/ruby 和我们稍后会用到的bunny gem。

第二步：实现事件发布入口脚本

这个脚本是连接Kubernetes和RabbitMQ的桥梁。它在容器启动时运行，取代了原始的docker-entrypoint.sh。它的核心职责是启动MariaDB后台服务，然后发布一条JSON格式的消息。

entrypoint.sh

#!/bin/bash
set -eo pipefail

# 引用原始的docker-entrypoint.sh来完成基本的初始化
# 这是一个常见的实践，避免重复造轮子
source /usr/local/bin/docker-entrypoint.sh

# 执行MariaDB的预启动检查和初始化
_main "$@" &

# 等待MariaDB套接字文件出现，确保服务已在后台初步启动
# 这里的超时和轮询逻辑在生产中需要更健壮
echo "Waiting for MariaDB socket to be available..."
for i in {30..0}; do
    if [ -S /run/mysqld/mysqld.sock ]; then
        break
    fi
    echo -n "."
    sleep 1
done
if [ "$i" = 0 ]; then
    echo >&2 "MariaDB socket not found, startup failed."
    exit 1
fi
echo "MariaDB service started in background."

# 从环境变量中获取Pod元数据和RabbitMQ连接信息
# 这些环境变量将通过Kubernetes Downward API和Secret注入
POD_NAME=${POD_NAME:-"unknown"}
POD_IP=${POD_IP:-"127.0.0.1"}
NAMESPACE=${NAMESPACE:-"default"}
RABBITMQ_HOST=${RABBITMQ_HOST}
RABBITMQ_USER=${RABBITMQ_USER}
RABBITMQ_PASSWORD=${RABBITMQ_PASSWORD}
RABBITMQ_EXCHANGE=${RABBITMQ_EXCHANGE:-"chef.config.events"}
RABBITMQ_ROUTING_KEY=${RABBITMQ_ROUTING_KEY:-"mariadb.galera.new_node"}

# 构建JSON消息体
# 在真实项目中，这里会包含更多信息，如云提供商、区域、实例类型等
MESSAGE_PAYLOAD=$(cat <<EOF
{
  "event_type": "NodeReadyForConfig",
  "node_name": "$POD_NAME",
  "namespace": "$NAMESPACE",
  "ip_address": "$POD_IP",
  "timestamp": "$(date -u +"%Y-%m-%dT%H:%M:%SZ")",
  "service": "mariadb-galera",
  "chef_run_list": "role[mariadb_galera_node]"
}
EOF
)

# 调用一个独立的Ruby脚本来发送消息
# 将逻辑分离可以使Bash脚本保持简洁
echo "Publishing configuration event to RabbitMQ..."
/opt/chef/embedded/bin/ruby <<HEREDOC
require 'bunny'
require 'json'

begin
  conn = Bunny.new(
    host:      '${RABBITMQ_HOST}',
    user:      '${RABBITMQ_USER}',
    password:  '${RABBITMQ_PASSWORD}',
    tls:       true, # 生产环境强制TLS
    tls_cert:  ENV['RABBITMQ_TLS_CERT'],
    tls_key:   ENV['RABBITMQ_TLS_KEY'],
    tls_ca_certificates: [ENV['RABBITMQ_CA_CERT']],
    verify_peer: true
  )
  conn.start
  ch = conn.create_channel
  x = ch.topic('${RABBITMQ_EXCHANGE}', durable: true)
  
  x.publish(
    '${MESSAGE_PAYLOAD}',
    routing_key: '${RABBITMQ_ROUTING_KEY}',
    persistent: true, # 确保消息持久化
    content_type: 'application/json'
  )

  puts "Successfully published event for node ${POD_NAME}."
  conn.close
rescue => e
  puts "Failed to publish event: #{e.message}"
  exit 1
end
HEREDOC

# 保持容器在前台运行，等待mysqld进程退出
wait $!

这个脚本有几个值得注意的地方：

它重用了官方镜像的docker-entrypoint.sh来处理数据目录初始化等标准工作。
它通过Downward API获取POD_NAME和POD_IP，这是Kubernetes推荐的Pod内省方式。
它通过内联Ruby脚本（Here Document）来调用bunny库，避免了创建额外的脚本文件，简化了镜像构建。
所有敏感信息，如RabbitMQ的密码和TLS证书，都应通过Kubernetes Secrets挂载为环境变量或文件。

第三步：部署到EKS的StatefulSet

StatefulSet是EKS上运行有状态应用的基石。它提供了稳定的网络标识符和持久化存储。

mariadb-statefulset.yaml

apiVersion: v1
kind: Service
metadata:
  name: mariadb-galera
  labels:
    app: mariadb-galera
spec:
  ports:
  - port: 3306
    name: mysql
  clusterIP: None # Headless Service
  selector:
    app: mariadb-galera
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: mariadb-galera
spec:
  serviceName: "mariadb-galera"
  replicas: 3
  selector:
    matchLabels:
      app: mariadb-galera
  template:
    metadata:
      labels:
        app: mariadb-galera
    spec:
      terminationGracePeriodSeconds: 30
      containers:
      - name: mariadb
        image: your-repo/mariadb-chef:latest # 使用我们构建的镜像
        command: ["/usr/local/bin/entrypoint.sh"]
        args: ["mysqld"]
        ports:
        - containerPort: 3306
          name: mysql
        - containerPort: 4567 # Galera Cluster traffic
          name: galera-repl
        - containerPort: 4568 # Galera IST
          name: galera-ist
        - containerPort: 4444 # Galera SST
          name: galera-sst
        env:
        # Downward API: 注入Pod元数据
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_IP
          valueFrom:
            fieldRef:
              fieldPath: status.podIP
        - name: NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        # 从Secret中获取RabbitMQ凭证
        - name: RABBITMQ_HOST
          valueFrom:
            secretKeyRef:
              name: rabbitmq-credentials
              key: host
        - name: RABBITMQ_USER
          valueFrom:
            secretKeyRef:
              name: rabbitmq-credentials
              key: user
        - name: RABBITMQ_PASSWORD
          valueFrom:
            secretKeyRef:
              name: rabbitmq-credentials
              key: password
        # 从ConfigMap获取其他配置
        - name: RABBITMQ_EXCHANGE
          valueFrom:
            configMapKeyRef:
              name: mariadb-config
              key: rabbitmq.exchange
        volumeMounts:
        - name: data
          mountPath: /var/lib/mysql
        # 将RabbitMQ的TLS证书作为文件挂载，更安全
        - name: rabbitmq-tls
          mountPath: "/etc/rabbitmq/tls"
          readOnly: true
      volumes:
      - name: rabbitmq-tls
        secret:
          secretName: rabbitmq-client-tls
  volumeClaimTemplates:
  - metadata:
      name: data
    spec:
      accessModes: [ "ReadWriteOnce" ]
      storageClassName: "gp2" # 根据你的AWS EKS配置选择
      resources:
        requests:
          storage: 10Gi

这个YAML定义了一个headless service，它为每个Pod提供一个唯一的、可预测的DNS名称（例如mariadb-galera-0.mariadb-galera.default.svc.cluster.local）。这对于Galera集群的节点发现至关重要。同时，它通过Downward API和Secrets安全地向容器注入了所需的环境变量。

第四步：Chef Cookbook的适应性改造

原有的Chef Cookbook可能硬编码了节点发现逻辑，或者依赖于Chef Search来查找集群成员。现在，它需要被改造以适应Kubernetes环境。

一个常见的错误是试图在Cookbook内部直接查询Kubernetes API。这会增加Cookbook的复杂性和对kubectl或相关库的依赖。更优雅的方式是通过Chef执行器在触发chef-client时，将环境信息作为属性（Attributes）注入。

Chef执行器（消费者）在收到消息后，会执行类似下面的命令：

# Chef Runner伪代码
pod_name = message.body['node_name']
pod_ip = message.body['ip_address']

# 查找所有集群成员的服务发现地址
# 这里使用Kubernetes DNS是最可靠的方式
cluster_dns = "mariadb-galera-0.mariadb-galera,mariadb-galera-1.mariadb-galera,..."

# 构造Chef属性JSON文件
cat > /tmp/attrs.json <<EOF
{
  "mariadb": {
    "galera": {
      "cluster_name": "eks_galera_cluster",
      "wsrep_node_address": "${pod_ip}",
      "wsrep_cluster_address": "gcomm://${cluster_dns}"
    }
  }
}
EOF

# 使用kubectl exec或SSH等方式在目标Pod上执行Chef
kubectl exec -it ${pod_name} -- \
  chef-client -j /tmp/attrs.json -N ${pod_name}

相应的，Chef Cookbook (recipes/galera.rb) 需要能够处理这些传入的属性：

# attributes/default.rb
default['mariadb']['galera']['cluster_name'] = 'default_cluster'
default['mariadb']['galera']['wsrep_node_address'] = node['ipaddress']
# 默认值为空，强制要求从外部注入
default['mariadb']['galera']['wsrep_cluster_address'] = '' 

# recipes/galera.rb
# ... 其他配置 ...

if node['mariadb']['galera']['wsrep_cluster_address'].empty?
  Chef::Log.fatal!('wsrep_cluster_address attribute is empty. It must be provided externally.')
  raise 'wsrep_cluster_address cannot be empty'
end

template '/etc/mysql/mariadb.conf.d/60-galera.cnf' do
  source 'galera.cnf.erb'
  owner 'mysql'
  group 'mysql'
  mode '0644'
  variables(
    cluster_name: node['mariadb']['galera']['cluster_name'],
    node_address: node['mariadb']['galera']['wsrep_node_address'],
    cluster_address: node['mariadb']['galera']['wsrep_cluster_address']
  )
  notifies :restart, 'service[mysql]', :immediately
end

service 'mysql' do
  action [:enable, :start]
end

这种模式下，Cookbook本身保持了对环境的无知，它的行为完全由传入的属性决定，极大地增强了其可移植性和可测试性。

方案的局限性与未来展望

尽管这套事件驱动的架构解决了最初的紧耦合问题，但它引入了新的依赖——RabbitMQ和Chef执行器服务的可用性。整个数据库集群的配置生命周期现在都依赖于消息队列的健康状况。这意味着必须对RabbitMQ本身进行高可用部署，并建立完善的监控告警，特别是针对消息积压和消费者处理延迟。

此外，Chef执行器成为了一个潜在的单点故障，尽管可以通过部署多个副本来缓解。一个更云原生的演进方向是开发一个专门的Kubernetes Operator。这个Operator会监听MariaDB Pod的事件，直接封装配置逻辑，取代外部的Chef执行器和RabbitMQ消息流。通过Operator，我们可以将整个配置流程定义为Kubernetes的自定义资源（CRD），实现更深度的平台整合和声明式管理，但这无疑是一个更复杂的工程挑战，需要对Kubernetes的控制器运行时有深入的理解。就目前而言，对于一个希望在不重写大量现有Chef代码的前提下快速迁移到EKS的团队来说，这种基于消息的异步解耦方案是一个成本效益极高的 pragmatic compromise。

AWS EKS MariaDB Chef RabbitMQ DevOps 数据库

构建面向毫秒级P99延迟的数据密集型UI的全栈架构选型与实现

2023-10-27 后端架构

ScyllaDB Relay Emotion Tyk

为基于Quarkus的Trino查询网关实现深入引擎的端到端分布式追踪

2023-10-27 可观测性

Java Quarkus Presto / Trino Datadog Observability