Skip to main content

Command Palette

Search for a command to run...

Monitor as Code 的一点尝试

Updated
1 min read

这篇的真实名字应该是:Grafana 也是有 API 的

在项目的 CI/CD 实践过程中,XX as code 是一个很重要的方法,利用代码的方式,对软件的构建、发布、测试等环节进行表达,一方面极大的提高了自动化程度;另一方面,将这些代码纳入版本管理范围,使其同软件代码同步更新和迭代,更好的体现了系统的整体性,提高了系统的可维护性。

前面的文章中我也多次提到了监控的内容,业务和系统的运行状况可视化是系统运行的重要支撑。甚至监控本身就应该是软件的一部分。得益于各种开源软件的支持,我们可以做一番 Monitor as Code 的尝试。

监控过程本身一般由数据的产生和展示两个部分组成,对于系统数据,例如 Kubernetes 或者主机数据,我们可以使用 Zabbix、Heapster 或者 cAdvisor 以及 Prometheus 进行获取;而业务的数据则需要借助业务应用自身的代码或者数据库来转换为指标数据,注入到 InfluxDB 等时间序列数据库中。本文中暂不介绍数据生成部分的内容。

最终我们继续选择 Grafana 进行数据的展示。这是这一篇里面唯一有用的内容了。

实际操作中,本文过程都应该在 Jenkins Pipeline 中,从版本库拉取代码完成,为叙述方便,使用 Shell 脚本代替。

步骤说明

  1. 代码准备

  2. Grafana 准备

  3. 创建、更新 Grafana Dashboard

代码准备

代码目录结构大致如下:

  • codebase

  • build

    • docker
  • ops

    • monitor

      • view

code base

一般用于存放业务代码。

build

该目录用于存放构建代码,例如

  • Jenkins Pipeline code

  • 构建过程中的支持脚本

  • Dockerfile

  • Kubernetes yaml

ops

这里用于放置运维相关的一些内容,本文将要使用的代码也在此存放。

实际上,这里除了 Grafana 的内容之外,还可以包含一些其他代码例如

  • Prometheus Exporter

  • Zabbix User Script

  • ...

Grafana 准备

首先在 Grafana 的管理菜单中创建一个权限为 Editor 的 API Token:

注意这里生成的 Key 只显示一次

创建或者更新 Grafana Dashboard

生成了 API Token 之后的事情就很简单了,准备一个 Grafana 的 JSON 文件,用 CURL 进行 POST 即可

POST /api/dashboards/db HTTP/1.1 Accept: application/json Content-Type: application/json Authorization: Bearer eyJrIjoiT0tTcG1pUlY2RnVKZTFVaDFsNFZXdE9ZWmNrMkZYbk

{
  "dashboard": {
    "id": null,
    "title": "Production Overview",
    "tags": [ "templated" ],
    "timezone": "browser",
    "rows": [
      {
      }
    ],
    "schemaVersion": 6,
    "version": 0
  },
  "overwrite": false
}

"id" 部分为 NULL 代表新建 Dahsboard。如果是从 Grafana 导出的内容,则沿用旧有取值进行更新即可。

可以利用模板+变量的方式来使用 Dashboard 导出文件,用于适应不同环境的部署下,不同的数据源名称,不同的细节调整。

More from this blog

龙虾恐慌:AIOps 又要改名了?

ChatGPT 开始,把 AI 拉近到普罗大众的面前,让无数人感受到 AI 的亲民魅力。而龙虾,则把大模型驱动的自动化能力,突然间变得水灵灵、活泼泼地走进千家万户。它不只是“风口上的猪”,而是风口本身。热度高到让 Mac mini 一度断货,不知道这在不在库克的预料之内。 每代人都有每代人的鸡蛋,春节期间,我就领了我的鸡蛋。翻出古老的 MacBook Air M1,充值各种大模型。当然了,这个工具

Mar 9, 20261 min read

再见 2025

我猜不少人以为这个号废了吧?并没有,只是今年变化有点大,一直有种抄起键盘,无从说起的感觉,所以一直偷懒到今天,2025 的最后一天。 今年是我的第四个本命年,去年末一期播客里,大内说本命年不是灾年,是变化年,有危也有机。可是讲真啊,只看到危,没看到机。 各种因缘际会,从鹅厂跳槽到前东家,已经接近四年,第一个合同期已经进入尾声。除了前两年还在云原生领域嗷嗷叫,后两年基本都是些鸡零狗碎的东西了,用老东家的术语说是——偏离主航道,可谓是前景暗淡了。 一旦确定要滚蛋,反倒心思轻松起来,每天骑着我的小红车...

Jan 5, 20261 min read

辅助编程?dora 说:我知道你很急可是请你别急

从 OpenGPT 把大模型的火烧旺了之后,这三年来,相信很多组织或摩拳擦掌、或躬身入局,希望借助聪明能干的大模型,或想偿还技术宅,或想降本增效,或想弯道超车。一时间,沉寂许久的 AIxx 又活过来了,LLM Ops、Vibe Coding、中医大模型、GPT 算命等等,全都老树发新芽,焕发了勃勃生机。那么视角拉回从业者最关注的饭碗相关的领域之一——AI 辅助开发,产生了什么触动,应该如何拥抱呢? DORA 的年度报告中给出了很有意思的结论——强者恒强。 执行摘要部分总结了几个有趣的点: 问题...

Oct 6, 20251 min read

[译]dora:ai 辅助软件开发状态报告

执行摘要 在 2025 年,科技领导者面临的核心问题已不再是“是否要采用 AI”,而是“如何实现其价值”。 DORA 的研究基于超过 100 小时的定性访谈和来自全球近 5,000 名技术专业人士的问卷调查。研究揭示了一个关键事实:AI 在软件开发中的主要角色是“放大器”。它会放大高效能组织的优势,也会凸显组织的缺陷。 关键结论:AI 是放大器 AI 投资的最大回报并非来自工具本身,而是来自组织底层系统的战略性建设: 高质量的内部平台 清晰的工作流 团队的协同能力 缺少这些基础,AI ...

Oct 2, 202514 min read

僭越了,有人在用 Rust 写 Kubernetes

一个新语言问世,最爱做的事情之一,就是重写存量软件了。 云原生喝酒 SIG 重点扶持项目——rk8s(https://github.com/rk8s-dev/rk8s) 也可以归在这个范畴里,只不过这个项目重写的东西比较大,是 Kubernetes。 从 2025 年 1 月第一个 Commit 开始,到现在有了 200 多次 Commit,十几万行代码。当然距离 Kubernetes 的几百万行代码还差得远——老马就是喜欢整这种大无畏项目。 另外该项目也是国内第一个脱离 Cargo 转向使用 ...

Sep 27, 20253 min read

【伪】架构师

342 posts

Exploring Monitor as Code