Skip to main content

Command Palette

Search for a command to run...

Linkerd + Namerd,实现 Kubernetes 集群的灰度发布

Updated
2 min read

主要内容源于 https://blog.buoyant.io/2016/11/04/a-service-mesh-for-kubernetes-part-iv-continuous-deployment-via-traffic-shifting/ ,砍掉了 Jenkins 等附加部分,更换了更加易于理解的示例应用,以保证主干突出。

Kubernetes 所提供的 rolling-update 功能提供了一种渐进式的更新过程,然而其滚动过程并不容易控制,对于灰度发布的需要来说,仍稍显不足,这里介绍一种利用 Linkerd 方案进行流量切换的思路。

官网介绍:linker∙d is a transparent proxy that adds service discovery, routing, failure handling, and visibility to modern software applications。

本文从实际操作入手,上线两个版本的简单应用,利用这一组合完成流量的切换和测试过程。

测试目标

  • 同时上线两个版本的应用。两个应用均可工作,利用不同输出进行区分。
  • 动态调整分配给两个版本的流量。
  • 利用 CURL 进行流量分配的测试。

准备工作

这里利用一个 1.2 以上版本的 Kubernetes 集群进行演示:

  • API Server / Registry:10.211.55.62
  • Node:10.211.66.63

另外因某些原因,需要有能力获取 Dockerhub 的镜像。

例子程序很简单,用一个 PHP 文件显示环境变量中的内容:

<?php
echo getenv("VAR_LABEL");

Docker file 继承自 dustise/lamp:latest,文件内容如下:

FROM dustise/lamp
COPY index.php /web/codebase

利用 Docker build 创建镜像,这里命名为 lamp:gray,备用。

创建工作负载

做一个简单的 yaml 文件来加载蓝绿两组应用,名字、环境变量和端口三个位置需要更改:

---
kind: ReplicationController
apiVersion: v1
metadata:
  name: green
# 此处省略若干
        env:
        - name: VAR_LABEL
          value: 'green'
---
kind: Service
apiVersion: v1

# 此处省略若干

  type: NodePort
  ports:
  - protocol: TCP
    nodePort: 32001
    port: 80
    targetPort: 80
    name: http
  selector:
    name: green

利用 kubectl create -f green.yaml ( 以及 blue.yaml )之后,可以利用 curl 或者浏览器检查运行情况,如果正常,两个端口的访问应该分别会返回 greenblue ,这里的端口命名很重要,这一名称会被后面的规则引用到。

注意,这里 NodePort 并非必须,仅为测试方便。

运行 Namerd

此处 yaml 主要来自于官网 https://raw.githubusercontent.com/BuoyantIO/linkerd-examples/master/k8s-daemonset/k8s/namerd.yml 为适应本地环境,将原有 Loadbalancer 类型的服务改为 NodePort

略微做一下讲解。

整个 yaml 由四部分组成:

ThirdPartyResource

这部分被用于做 Namerd 的存储后端。

Configmap

作为 Namerd 的配置,其中定义了这样几个内容(详情可参见 https://linkerd.io/config/0.8.5/namerd/index.html#introduction):

  • 管理端口 9990
  • storage:存储定义,通过 8001 端口同 Kube Api Server 通信,完成在 ThrdPartyResource 中的访问(8001 端口由 kubectl proxy 指令开通)
  • namer:定义服务发现能力由 Kubernetes 提供。
  • interface 部分则是定义了两种支持协议。其中 HTTP Controller 可以接收 namerctl 的控制指令。

RC

这部分不新鲜,除了 namerd 之外,还利用 kubectl proxy 提供通信端口给 namerd,颇有蛇足之嫌。正确的打开方式应该是直接和 Kube API Server 进行通信。

Service

这里注意服务类型的变更( LoadBalancer -> NodePort ),需要暴露 4180 和 9990 两个端口,分别作为控制端口和界面端口。

利用 kubectl 启用之后,就可以在指定的端口查看管理界面了。此时的管理界面没有做任何配置,因此比较单薄。

添加规则

下面来安装 namerd 的控制工具,namerctl

go get -u github.com/buoyantio/namerctl go install github.com/buoyantio/namerctl

接下来创建一条规则:

/host=>/#/io.l5d.k8s/default/http; /http///=>8/host/blue&2*/host/green;

这段代码表示该服务同时连接 blue 和 green 两个后端服务,按照 80/20 的比例进行流量分配。

namerctl dtab create [file name] --base-url,这里 base-url 取值就是我们给 namerd 设置的 Nodeport。

接下来就能够看到管理界面上显示出新的规则了。

运行 Linkerd

这里同样基于官方的 https://raw.githubusercontent.com/BuoyantIO/linkerd-examples/master/k8s-daemonset/k8s/linkerd-namerd.yml

需要注意的是,官方给出的 yaml 文件中有一处 bug,使得这个 yaml 只能在缺省的 namespace 和 domain suffix 下运行。需要纠正对 namerd 的访问方式,删除 Namerd 后面的 default.svc.cloud.local 即可。

同样的,他的服务端口和管理端口都应该改用 NodePort 方式进行暴露。

运行后,同样可以看到 Linkerd 的管理界面。

测试

下面可以做一个简单的测试,来证明流量分配的有效性:

for ((i=1;i<=300;i++)); do curl -s "http://10.211.55.63:30001/";echo ""; done | grep -i blue| wc -l

可以看到,随着循环次数的增加,其结果越来越趋近于 80/20 的分配比例。

接下来,我们修改上面的 dtab 为如下内容:

/host=>/#/io.l5d.k8s/default/http; /http///=>8/host/blue&8*/host/green;

重新进行测试,就可以看到,流量分配已经发生了变化。另外,还可以在 Linkerd 的管理界面上看到网络流量的变化情况。

结语

这一组合基本能够满足流量渐变分配的功能需求,同时也有如豆瓣这样的大厂使用,但他的 dtab 还是个相对复杂的东西,如果在生产上进行使用,还是需要进一步的学习。

另外,按照其文档中所陈述的功能范围内容来看,仅用来做流量分配还是颇有点大材小用的味道,从个人来说,我倾向于一些更轻量级的解决方法。

More from this blog

龙虾恐慌:AIOps 又要改名了?

ChatGPT 开始,把 AI 拉近到普罗大众的面前,让无数人感受到 AI 的亲民魅力。而龙虾,则把大模型驱动的自动化能力,突然间变得水灵灵、活泼泼地走进千家万户。它不只是“风口上的猪”,而是风口本身。热度高到让 Mac mini 一度断货,不知道这在不在库克的预料之内。 每代人都有每代人的鸡蛋,春节期间,我就领了我的鸡蛋。翻出古老的 MacBook Air M1,充值各种大模型。当然了,这个工具

Mar 9, 20261 min read

再见 2025

我猜不少人以为这个号废了吧?并没有,只是今年变化有点大,一直有种抄起键盘,无从说起的感觉,所以一直偷懒到今天,2025 的最后一天。 今年是我的第四个本命年,去年末一期播客里,大内说本命年不是灾年,是变化年,有危也有机。可是讲真啊,只看到危,没看到机。 各种因缘际会,从鹅厂跳槽到前东家,已经接近四年,第一个合同期已经进入尾声。除了前两年还在云原生领域嗷嗷叫,后两年基本都是些鸡零狗碎的东西了,用老东家的术语说是——偏离主航道,可谓是前景暗淡了。 一旦确定要滚蛋,反倒心思轻松起来,每天骑着我的小红车...

Jan 5, 20261 min read

辅助编程?dora 说:我知道你很急可是请你别急

从 OpenGPT 把大模型的火烧旺了之后,这三年来,相信很多组织或摩拳擦掌、或躬身入局,希望借助聪明能干的大模型,或想偿还技术宅,或想降本增效,或想弯道超车。一时间,沉寂许久的 AIxx 又活过来了,LLM Ops、Vibe Coding、中医大模型、GPT 算命等等,全都老树发新芽,焕发了勃勃生机。那么视角拉回从业者最关注的饭碗相关的领域之一——AI 辅助开发,产生了什么触动,应该如何拥抱呢? DORA 的年度报告中给出了很有意思的结论——强者恒强。 执行摘要部分总结了几个有趣的点: 问题...

Oct 6, 20251 min read

[译]dora:ai 辅助软件开发状态报告

执行摘要 在 2025 年,科技领导者面临的核心问题已不再是“是否要采用 AI”,而是“如何实现其价值”。 DORA 的研究基于超过 100 小时的定性访谈和来自全球近 5,000 名技术专业人士的问卷调查。研究揭示了一个关键事实:AI 在软件开发中的主要角色是“放大器”。它会放大高效能组织的优势,也会凸显组织的缺陷。 关键结论:AI 是放大器 AI 投资的最大回报并非来自工具本身,而是来自组织底层系统的战略性建设: 高质量的内部平台 清晰的工作流 团队的协同能力 缺少这些基础,AI ...

Oct 2, 202514 min read

僭越了,有人在用 Rust 写 Kubernetes

一个新语言问世,最爱做的事情之一,就是重写存量软件了。 云原生喝酒 SIG 重点扶持项目——rk8s(https://github.com/rk8s-dev/rk8s) 也可以归在这个范畴里,只不过这个项目重写的东西比较大,是 Kubernetes。 从 2025 年 1 月第一个 Commit 开始,到现在有了 200 多次 Commit,十几万行代码。当然距离 Kubernetes 的几百万行代码还差得远——老马就是喜欢整这种大无畏项目。 另外该项目也是国内第一个脱离 Cargo 转向使用 ...

Sep 27, 20253 min read

【伪】架构师

342 posts