CD+服务网格灰度发布实践,一文带你体验如何编排更灵活

时间:2022-07-23
本文章向大家介绍CD+服务网格灰度发布实践,一文带你体验如何编排更灵活,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

作者廖红坤,CODING DevOps 产品策划。从事过多年运维开发,云计算、Kubernetes、云原生深度实践者,有丰富的 DevOps 平台设计经验。

1. 前言

灰度发布(又名金丝雀发布)可实现业务从老版本到新版本的平滑过渡,并避免升级过程中出现的问题对用户造成的影响。在云原生的背景下,像 Kubernetes 这样的平台可实现简单的灰度发布,但其功能非常有限,只能通过控制 Pod 副本比例管理流量,并且不支持根据特定规则将请求路由到灰度版本。而使用 isito,副本部署和流量管理是两个完全独立的功能,服务的 Pod 数量可以根据流量负载灵活伸缩,与版本流量路由的控制完全正交;基于 istio,可以轻松实现细粒度控制流量百分比(例如,路由 1% 的流量到灰度版本),当然也可以使用其他规则(如:url、headers等)来控制流量。

腾讯云服务网格(Tencent Cloud Mesh,TCM)是一致、可靠、透明的云原生服务通信网络管控基础平台,全面覆盖应用程序的南北向与东西向通信连接,基于 istio 在开源版本的基础上优化了 envoy 的转发性能,并实现控制面托管/多活以及多集群网格产品化,可以支撑业务轻松打造灵活的分布式高可用架构,高效便捷的变更发布能力和安全可控的服务通信网络。

灰度发布流程涉及多个微服务部署、人工审核、灰度比例控制等步骤,基于 CODING CD(持续部署),可以实现灰度发布流程的灵活编排,在关键节点进行人工审核、动态指定灰度比例,使用表达式控制分支流程等特性。

接下来我们将结合 CODING CD 和 TCM 演示灰度发布流程。

2. 灰度发布 Demo 演示

2.1 Bookinfo 应用

我们以 istio 官方的 Bookinfo 示例项目作为 demo,并在它的基础上做了 yaml 配置优化,更符合 CODING + TCM 灰度发布的 Demo 演示。对于不熟悉 istio 的同学,有必要对 Bookinfo 应用做简单的介绍。

Bookinfo 应用由四个单独的微服务构成。这个应用模仿在线书店的一个分类,显示一本书的信息。页面上会显示一本书的描述,书籍的细节(ISBN、页数等),以及关于这本书的一些评论。

Bookinfo 应用分为四个单独的微服务:

  • productpage. 这个微服务会调用 detailsreviews 两个微服务,用来生成页面。
  • details. 这个微服务中包含了书籍的信息。
  • reviews. 这个微服务中包含了书籍相关的评论。它还会调用 ratings 微服务。
  • ratings. 这个微服务中包含了由书籍评价组成的评级信息。

reviews 微服务有 3 个版本:

  • v1 版本不会调用 ratings 服务。
  • v2 版本会调用 ratings 服务,并使用 1 到 5 个黑色星形图标来显示评分信息。
  • v3 版本会调用 ratings 服务,并使用 1 到 5 个红色星形图标来显示评分信息。

下图展示了这个应用的端到端架构。

Bookinfo 应用中的几个微服务是由不同的语言编写的。这些服务对 Istio 并无依赖,但是构成了一个有代表性的服务网格的例子:它由多个服务、多个语言构成,并且 reviews 服务具有多个版本。

阅读更多:Bookinfo 应用:https://istio.io/latest/zh/docs/examples/bookinfo/

基于 Bookinfo 应用,我们将演示如下的灰度发布效果:

  1. 部署 bookinfo 应用的基准版本(v1),即四个微服务 productpagedetailsreviewsratings都是 v1 版本
  2. 腾讯云服务网格 TCM  控制台查看网格拓扑
  3. 部署 reviews 服务的灰度版本(v2)
  4. 设置灰度比例
  5. 人工确认是否全量发布
  6. 将所有流量切换到灰度版本(v2)

2.2 部署基准版本(v1)

在 CODING 持续部署(CD)提交发布单,部署基准版本(v1)。配置制品处分别选择应用、Ingress Gateway、Destination Rule 和 VirtualServices 对应的 yaml 文件。

部署完成后,在 TCM(服务网格)控制台查看生成的网络拓扑(网格拓扑中看不到 ratings-v1是因为reviews-v1没有调用ratings-v1)。

查看 Gateway 的信息,根据外网 IP 访问 bookinfo 服务。

浏览器打开网址 http://120.53.204.21/productpage 浏览 bookinfo 应用的 Web 页面,无论怎么刷新页面都发现 reviews 服务只有 v1 版本的效果(没有红色或黑色的星形)。

2.2 灰度发布(v2)

在 CODING CD 提交发布单,执行灰度发布流程。

配置制品处填写reviews v2 yaml 文件的路径(platform/kube/bookinfo-reviews-v2.yaml)和分支;reviews 服务增加灰度版本后,需要更新 Destination Rule(包含 v1 和 v2 的配置),填写 Destination Rule 的路径(networking/destination-rule-v1-v2.yaml)和分支。

启动参数指定基准版本和灰度版本(即 v1 和 v2)。

设置灰度比例为 50% 。

在 TCM 控制台查看网络拓扑已更新(productpage-v1 的请求会被转发到 reviews-v1reviews-v2)。

执行完下一阶段,灰度比例生效后,访问 http://120.53.204.21/productpage 会发现 reviews 服务的 v1 和 v2 版本流量各占 50%(黑色星形和没有星形交替出现)。

当确认灰度版本(v2)版本稳定后,选择全量发布,将所有流量切换到灰度版本(v2)。

在 TCM 控制台查看网络拓扑已更新(没有 reviews-v1)。

访问 http://120.53.204.21/productpage 会发现 reviews 服务所有流量都发送到 v2 版本。即无论怎么刷新页面都发现 reviews 服务只有 v2 版本的效果(只显示黑色星形)。

3. 配置过程

具体是如何实现上述的灰度发布效果呢,接下来跟着本教程动手实践。

3.1 TKE 集群

使用腾讯云 TKE 创建一个 Kubernetes 集群:https://cloud.tencent.com/document/product/457/11741

3.2 TCM

在 TKE 控制台创建服务网格实例,服务发现处选择上一步骤创建的 TKE 集群;并开启 default 命名空间的 sidecar 自动注入功能。

3.3 CODING DevOps

如果你没有 CODING DevOps 账号,请在腾讯云控制台访问 CODING DevOps,根据提示开通即可。

3.3.1 代码仓库

克隆源代码并推送到自己的 CODING 代码库。

git clone https://ci-cd.coding.net/public/bookinfo/bookinfo/gitgit remote remove origingit remote add origin 你的 CODING 代码库地址git push origin master

3.3.2 添加云账号

在 CODING 持续部署添加 TKE 集群。

3.3.3 创建应用并配置部署流程

进入 CODING 持续部署控制台创建名为 bookinfo 的应用,然后配置部署流程。

部署基准版本(v1)

配置了 4 个启动所需制品分别是:

  • platform/kube/bookinfo-reviews-v1.yaml:部署 bookinfo 四个微服务的 v1 版本。
  • networking/bookinfo-gateway.yaml:配置 istio-Ingressgateway 的监听器规则,开放 80 端口 http 协议。
  • networking/destination-rule-all-reviews-v1.yaml:部署四个微服务 v1 版本的Destination Rule。
  • networking/virtual-service-all-v1.yaml:部署四个微服务 v1 版本的 Virtual Services。

在第二个阶段部署 Ingress 网关 执行完成后,就可以通过 Gateway 的外网 IP 访问 bookinfo 应用。后续两个阶段的作用是使用 TCM 对 bookinfo 进行流量管理。

reviews 灰度发布

配置了两个启动所需制品分别是:

  • canary-reviews-deployment:reviews 服务灰度版本的 Deployment 内容,在此 demo 中将会使用文件 platform/kube/bookinfo-reviews-v2.yaml
  • canary-reviews-destination-rule:包含 v1 和 v2 的 subset 配置,在此 demo 中将会使用文件 networking/destination-rule-v1-v2.yaml

设置灰度比例是一个人工确认阶段,通过参数 canary-ratio 指定灰度比例。

灰度比例生效是一个 VirtualService 模板,可根据部署流程启动参数和上一阶段的 canary-ratio 参数对 reviews 服务的流量进行动态管理。

apiVersion: networking.istio.io/v1alpha3kind: VirtualServicemetadata:  name: reviewsspec:  hosts:    - reviews  http:    - route:        - destination:            host: reviews            subset: '${parameters.base_version}'          weight: >-            ${100 -            #toInt(#stage("设置灰度比例")["context"]["customParams"]["canary_ratio"])}        - destination:            host: reviews            subset: '${parameters.canary_version}'          weight: >-            ${#toInt(#stage("设置灰度比例")["context"]["customParams"]["canary_ratio"])}

最后两个阶段可以根据是否全量发布阶段的确认选项(通过 #judgment(是否全量发布) 表达式获取上一阶段的确认选项),判断全量发布灰度版本或直接结束部署流程。

以上两个部署流程的 json 配置存放在 bookinfo 代码仓库的 coding-cd-template 目录中,可直接导入 CODING CD 快速创建部署流程。

3.3.4 将应用关联到项目(在项目内提交发布单)

部署流程配置完成后,将应用关联到项目,即可在项目内提交发布单,实现 reviews服务的灰度发布。

4. 小结

本文主要聚焦基于 CODING CD + TCM 的灰度发布实践,没有涉及更多 CODING DevOps 的能力。除了以上的灰度发布 Demo,你可以基于 CODING 平台实现一站式 DevOps 研发实践。具体来说,上述的灰度发布 Demo 可以结合 CODING 持续集成、制品库;实现代码提交后,自动构建 bookinfo 各微服务的 Docker 镜像上传到制品库,推送完成后自动触发灰度发布的流水线执行。

此外,结合 CODING CD + TCM,还可以拓展更多的微服务治理和发布能力,比如:

  • 自动化金丝雀分析和部署。
  • 利用 TCM 对微服务进行故障注入演练,当监测到系统指标异常时通过 Webhook 自动触发 COIDNG CD 执行回滚流程。
  • 基于 TCM 的熔断和限流能力,通过 CODING CD 联动监控系统(如腾讯云监控),实现业务系统压力较大时自动触发熔断和限流的部署流程,保证业务稳定。

5. 公开资源和参考资料