Skip to main content

Command Palette

Search for a command to run...

Kubernetes 集群资源的那些事

Updated
2 min read

大多数时候,我们在跟 K8S 玩耍的时候,主要目的就是:“把 XXX 打个镜像,在集群上跑起来 ——— 诶快看,真的跑起来了嘿!”。

Kubernetes 和 Docker 的缺省配置,就能够帮我们省却很多麻烦。不过大家都很清楚,资源问题是无法回避的,我们在传统 IT 环境下遇到的各种资源相关问题,在容器集群环境下一样要得到解决,多租户动态分配环境下,这些问题会更加复杂。

本文仅是一个索引,不准备也没能力做过多的深入,只是将一些需要注意的内容罗列出来做一些大致介绍。 有些内容称作资源可能并不是很恰当,暂时存在资源这个筐里吧。

磁盘

Volume

一般我们会用存储卷的方式来给 Pod 提供存储资源。

起初的存储卷,在用量的控制方面,只能借存储的实际提供者的能力来进行。例如可以限制 GlusterFS 中 Volume 的大小。

接下来出现了 Persistent Volume (PV) 和 Persistent Volume Claim (PVC) 这一组对象,完成了 “生产——消费” 关系,这就可以通过 Provision -> Claim 的方式,来对存储资源进行控制。

而最新版本中还出现了动态卷供给的功能,能够对这一部分功能进行简化,无需首先建立 PV,直接建立 PVC 即可。

有了 PVC 这一能力之后,Kubernetes 就借用这一对象对 Namespace 的存储访问进行了限制:

对象名称解释
requests.storage所有的 PVC 申请容量之和不能超过此数值
persistentvolumeclaims一个 Namespace 中 PVC 的总数(Count)
<storage-class-name>.storageclass.storage.k8s.io/requests.storage所有针对该 StorageClass 的 PVC 所申请的存储总容量不得超出这一数值
<storage-class-name>.storageclass.storage.k8s.io/persistentvolumeclaims所有针对该 StorageClass 最多能创建的 PVC 数量

日志

目前我们在实际使用中,爆磁盘的原因,除了对存储卷的控制不够之外,还有一个重要的点就是容器的日志,缺省情况下 Docker 使用的日志驱动是 json-file,这一驱动有个附加参数 --log-opt max-size=[size] 可以用来限制日志的最大占用空间。

Docker 官方文档 还提供了很多其他的日志选项供选择。

Node

除了上面讲到的集群层面的问题之外,磁盘空间还对 Node(Kubelet) 的健康有重大影响。Kubelet 有几个参数用于对存储使用进行控制:

  • --low-diskspace-threshold-mb:如果剩余空间低于这一限制,则拒绝在这一 Node 上新建 Pod(目前建议用新的驱逐规则来代替这一参数)。
  • --image-gc-high-threshold:高于该值则启动 GC。
  • --image-gc-low-threshold:低于该值拒绝启动 GC。

在驱逐策略中,提供了如下几个磁盘相关的参数:

  • nodefs.available
  • nodefs.inodesFree
  • imagefs.available
  • imagefs.inodesFree

这里把 Node 磁盘分为 node 和 image 两种分别度量其 available 和 inodes,应该说比上面的 threshold 更加精确了

CPU 和内存

这一对资源应该算是 Kubernetes 中的 “经典” 资源了。Kubernetes 对 CPU 和内存提供了 requests/limits 两种度量,可以在 Container 的 Spec 中进行指定。

在 namespace 一级中,提供了如下的总量限制:

  • limits.cpu:所有非结束状态的 Pod 的 CPU limit 总数。
  • limits.memory:所有非结束状态的 Pod 的 内存 limit 总数。
  • requests.cpu:所有非结束状态的 Pod 的 CPU request 总数。
  • requests.memory:所有非结束状态的 Pod 的 CPU request 总数。

Node

和前面的磁盘的情况类似,Kubelet 中对 CPU 和内存也有新旧两套切换中的体系来进行限制:

  • --kube-reserved

驱逐策略中提供了如下参数:

  • memory.available

quota 和 limitrange

这是两个不同的 API Object,分别对应 namespace 的配额,和运行应用(Pod/Container)的资源限制。

GPU

这方面基本没有接触,但是随着深度学习之类名词的迅速炒热,相信 Kubernetes 会快速跟进的。

将在 1.6 中推出多 GPU 支持的 Alpha 版本。

网络

在 1.5 中,网络策略已经成为 Beta 版本,利用这一对象,横向可以实现 namespace 之间的隔离;纵向可以定义 namespace 内不同职责应用的网络访问能力。这就有效的阻断了不同租户之间利用 dns 进行授权之外的访问的途径。

参考资料:

  • 网络策略:https://kubernetes.io/docs/user-guide/networkpolicies/
  • 驱逐策略:http://blog.fleeto.us/translation/configuring-out-resource-handling
  • 存储:
    • http://blog.fleeto.us/translation/dynamic-provisioning-and-storage-classes-kubernetes
    • http://blog.fleeto.us/translation/persistent-volumes

More from this blog

龙虾恐慌:AIOps 又要改名了?

ChatGPT 开始,把 AI 拉近到普罗大众的面前,让无数人感受到 AI 的亲民魅力。而龙虾,则把大模型驱动的自动化能力,突然间变得水灵灵、活泼泼地走进千家万户。它不只是“风口上的猪”,而是风口本身。热度高到让 Mac mini 一度断货,不知道这在不在库克的预料之内。 每代人都有每代人的鸡蛋,春节期间,我就领了我的鸡蛋。翻出古老的 MacBook Air M1,充值各种大模型。当然了,这个工具

Mar 9, 20261 min read

再见 2025

我猜不少人以为这个号废了吧?并没有,只是今年变化有点大,一直有种抄起键盘,无从说起的感觉,所以一直偷懒到今天,2025 的最后一天。 今年是我的第四个本命年,去年末一期播客里,大内说本命年不是灾年,是变化年,有危也有机。可是讲真啊,只看到危,没看到机。 各种因缘际会,从鹅厂跳槽到前东家,已经接近四年,第一个合同期已经进入尾声。除了前两年还在云原生领域嗷嗷叫,后两年基本都是些鸡零狗碎的东西了,用老东家的术语说是——偏离主航道,可谓是前景暗淡了。 一旦确定要滚蛋,反倒心思轻松起来,每天骑着我的小红车...

Jan 5, 20261 min read

辅助编程?dora 说:我知道你很急可是请你别急

从 OpenGPT 把大模型的火烧旺了之后,这三年来,相信很多组织或摩拳擦掌、或躬身入局,希望借助聪明能干的大模型,或想偿还技术宅,或想降本增效,或想弯道超车。一时间,沉寂许久的 AIxx 又活过来了,LLM Ops、Vibe Coding、中医大模型、GPT 算命等等,全都老树发新芽,焕发了勃勃生机。那么视角拉回从业者最关注的饭碗相关的领域之一——AI 辅助开发,产生了什么触动,应该如何拥抱呢? DORA 的年度报告中给出了很有意思的结论——强者恒强。 执行摘要部分总结了几个有趣的点: 问题...

Oct 6, 20251 min read

[译]dora:ai 辅助软件开发状态报告

执行摘要 在 2025 年,科技领导者面临的核心问题已不再是“是否要采用 AI”,而是“如何实现其价值”。 DORA 的研究基于超过 100 小时的定性访谈和来自全球近 5,000 名技术专业人士的问卷调查。研究揭示了一个关键事实:AI 在软件开发中的主要角色是“放大器”。它会放大高效能组织的优势,也会凸显组织的缺陷。 关键结论:AI 是放大器 AI 投资的最大回报并非来自工具本身,而是来自组织底层系统的战略性建设: 高质量的内部平台 清晰的工作流 团队的协同能力 缺少这些基础,AI ...

Oct 2, 202514 min read

僭越了,有人在用 Rust 写 Kubernetes

一个新语言问世,最爱做的事情之一,就是重写存量软件了。 云原生喝酒 SIG 重点扶持项目——rk8s(https://github.com/rk8s-dev/rk8s) 也可以归在这个范畴里,只不过这个项目重写的东西比较大,是 Kubernetes。 从 2025 年 1 月第一个 Commit 开始,到现在有了 200 多次 Commit,十几万行代码。当然距离 Kubernetes 的几百万行代码还差得远——老马就是喜欢整这种大无畏项目。 另外该项目也是国内第一个脱离 Cargo 转向使用 ...

Sep 27, 20253 min read

【伪】架构师

342 posts