Kube-Node:让 Kubernetes 自行管理节点

原文:Kube-Node: Let Your Kubernetes Cluster Auto-Manage Its Nodes

本文是一个系列中的一篇,来自于 CNCF 成员,为奥斯汀 12.6-12.8 的 KubeCon/CloudNativeCon 而做。

Michelle Noorali 在今年三月份的欧洲 KubeCon 上的 KeyNote中说到:Kubernetes 对开发人员来说还是太难了。原则上来说,开发人员对 Kubernetes 和容器技术是非常热爱的,这一系列的技术让开发人员编写的应用能够到处运行,却无需担心基础设施的差异。但事实上,这一技术体系还是有很多依赖的,这些依赖很大程度上磨灭了用户的热情。

对开发人员来说,Kubernetes 有个主要的障碍就是他无法对其服务器进行自动管理和伸缩,因此一个工作节点的部署或移除都少不了运维工程师的参与。当然目前有很多节点部署方案,例如 TerraformChef 以及 Puppet,这些技术让运维人员的日子好过了点。然而上述技术都需要一些特定领域的知识;目前还不存在一种无须运维接入的通用的跨平台方法。

目前的节点部署方法

Kubernetes 节点的生命周期,同其他的 Kubernetes 资源的生命周期是不一致的,这是 Kubernetes 节点部署和管理的一个主要问题。当下的节点管理生命周期里,节点是在一台服务器加入集群之后创建的。然而一般的 Kubernetes 资源并不是这样的:首先创建资源,然后才加入服务器。

这种情况是不合理的。为了解决这一问题,来让节点的管理工作纳入正轨,我们决定启动 kube-node 这一社区项目。我们的目标是为 Kubernetes 开发一个类似 持久卷系统 的原生节点整合方案。

持久卷系统从各种云中抽象出了存储的供给和使用的功能。这种抽象把存储卷的生命期从环境中独立出来,令其可以被动态的分配和管理。

如何设置 Kube-Node

类似持久卷的设置,Kube-Node 是一个高级别的抽象系统:

  • 管理员进行配置的定义
  • 开发人员可以使用简单的kubectl create node -f node1.yaml来对集群进行扩容
  • Kubernetes 控制节点的生命周期

为了达成这一目标,我们引入了两个新的 API 资源:NodeClass 和 NodeSet,这些资源由 NodeController 和 NodeSetController 来进行管理。

  • NodeSet 保证任意时间内都有指定数量的节点正在运行。跟 ReplicaSet 类似,NodeSet 要保障一个节点或者一系列的同质化节点的运行和可用状态。 NodeSet 来自于 NodeClass,其细节定义在 Node 模板中。
  • NodeClass 让管理员有了为新节点设置配置的可能性。NodeClass 包括了云供应商和操作系统特定的细节,例如认证信息、机器类型等数据。另外管理员还可以定义服务质量水平和策略。Kubernetes 不能干涉 NodeClass 的定义。
  • NodeSetController 会关注 NodeSet,负责节点的创建和删除工作。在目前的实现中,他管理节点资源的创建,并跟 GKE 的节点池进行同步。
  • NodeController 关注节点对象并在云端进行服务器的供应。服务器加入集群之后,kubelet 会更新节点资源;类似的,在节点对象被删除的时候,NodeController 会从云端删除这一服务器。

kube-node

概述和路线

kube-node 是一个社区项目,用于提供通用的 Kubernetes 节点管理手段。目标是为开发者提供一个无需运维介入的、基础设施无关的简单方式,来对集群进行伸缩。其中包含了基于 CustomResourceDefinition 的类型、client-go 为基础的客户端以及 NodeController 和 NodeSetController。

首先会实现 NodeSetController 和 NodeController 的联动,接下来会和 GKE 节点池进行集成。上面的两个步骤会针对各种不同用例来进行概念的验证。NodeController 的第一步会复用 docker-machine 的一部分代码,称为 kube-machine,用于和多个不同的云供应商中加载服务器。

下一步,我们计划把 NodeSet 和 Kubernetes 的自动伸缩功能进行集成,让 NodeController 根据集群负载,能够自动对 NodeSet 的实例数进行设置。这一集成能够让 Kubernetes 在多种不同的平台上实现集群的自动伸缩。另外我们会实现更多的 NodeController,包括 Terraform、Python 或者 AWS。

Avatar
崔秀龙

简单,是大师的责任;我们凡夫俗子,能做到清楚就很不容易了。

comments powered by Disqus
下一页
上一页

相关