Skip to main content

Command Palette

Search for a command to run...

2025 年基础设施即代码(IaC)状况报告

Updated
3 min read

原文:[The State of IaC 2025](https://www.firefly.ai/state-of-iac-2025?)


对于 IaC 采用、成熟度和影响力的年度调查

执行摘要

对于云从业者来说,IaC 年度状态报告的重要性正在逐步凸显,该报告帮助云从业者应对多云环境的复杂性、云基础设施管理和不断变化的 IaC 工具。

今年,我们调查了数百名专业人士,并整合了他们的反馈,以帮助我们评估、记录并塑造 IaC 和云管理的未来。

以下是我们 2025 年的主要发现。


云变得越来越复杂,多云、多 IaC 变得更加普遍。

  • 68% 的公司使用多云环境

  • 多 IaC 成为常态,约 57% 受访者表示正在使用两个或者更多的 IaC 框架


绝大多数受访者都已开始使用 IaC,但是云资源被完全代码化的的案例极少。

89% 的组织采用了 IaC,使用代码定义全部基础设施的却只有约 6%


Terraform 仍占据统治地位,但是 OpenTofu 正在高歌猛进。

  • Terraform 占据统治地位。Terraform 坐拥 62% 的市场份额,但是只有 47% 的受访者计划未来使用 Terraform。

  • OpenTofu 涨势良好,然而仅有 5% 的受访者表示已经完成从 Terraform 到 OpenTofu 的迁移,另外有 6% 受访者计划明年进行迁移。


使用 IaC 的三大益处之一就是漂移管理,但大多数方法只是被动的和高度人工化的。

  • 环境的持续性和标准化是防止漂移的关键,在 2025 年调查中,这个点被评为 IaC 优势的前三名。27% 受访者认为这是 IaC 最大的优势。

  • 虽然漂移管理是个重点,但是只有不足 1/3 的组织对其进行主动监控和配置恢复。


受访者对 AI 云管兴趣浓厚,但是态度谨慎。

  • 17% 的团队已经在云运维过程中使用 AI 驱动的能力

  • 另外 41% 团队计划在半年内使用 AI 或者正在积极探索解决方案。


2025 年,绝大多数云从业者还在追赶 IaC

IaC 得到了广泛采用,但是 100% (基础设施)代码化的屈指可数。

决定采用 IaC 很容易,但是数据表明,要达到 100% 的 IaC 覆盖,则需要专项的资源和工具。云工程师认可 IaC 的价值,并已经开始从 IaC 中取得收益。

然而 IaC 的成熟之路上,还是充满挑战。从业者们在管理云基础设施时,面临的最大问题包括技能缺陷(团队要寻求自动化和规范从而打破知识壁垒),工具混乱,并且 IaC 难于覆盖到存量和传统资源。这些问题又会导致后续的管线管理困难。

IaC 的五个最大优势

  1. 持续性 :确保环境配置不会漂移

  2. 可靠性和稳定性

  3. 部署效率:更快的资源供给

  4. 治理和安全

  5. 不可变

另外,65% 的受访者认为最近两年的云变得复杂了,还有 27% 的受访者表示最近两年并没有发生变化。

虽然受访者没有将安全列为首位,但是 61% 的受访者表示安全/合规风险正在随着云规模的扩大而扩大。

上图表明,虽然有团队已经面临并觉察了更多的风险,但是还没来得及建设正式的治理体系来进行应对。有些团队可能已经面临停机风险,同时缺乏恢复手段,甚至这些团队还没能觉察这些问题。

过去两年,云管理难度并未降低。存在几个关键因素。

因素保持不变 (%)变得更难 (%)变得更容易 (%)
复杂性/知识要求206515
时间要求255520
成本157015
安全和合规风险107515

随着云弹性和灾难恢复基础设施变得越来越重要,企业转向 laC,将其作为云基础设施备份和恢复解决方案的基础层。

接下来将深入这次调查中的显著亮点。

Terraform 的统治地位正在受到削弱和威胁

Terraform 虽然保持了市场份额,然而 IaC 的权利更迭正在发生。

市场正在对从 Terraform 迁移到 OpenTofu 表现出兴趣

类别百分比 (%)
无计划从 Terraform 迁移47
等待 OpenTofu 更成熟17
评估 OpenTofu13
其他计划12
在未来 12 个月内计划迁移6
已迁移到 OpenTofu5

绝大多数调研对象都正在使用 Terraform,但是其统治地位已经有了动摇迹象:12% 使用了 OpenTofu,造成这一局面的一个重要原因就是近期 Terraform 授权的变化。27% 的受访者正在计划未来使用 OpenTofu。在这些正在从 Terraform 切换到 OpenTofu 的案例中,约 5% 已经完成了迁移,另外约 6% 计划在未来 12 个月内启动迁移。Pulumi 和 Crossplane 也得到了 更多关注。

很明显,社区正在积极的寻找替代品,这也意味着工程师需要面对多个 IaC 框架。但是,虽说 2025 年,IaC 工具的多样性趋势已经明显,我们还是要继续观察,这种多样性会引发更多创新,还是造成更多的工具碎片。

尽管如此,IBM 收购 Hashicorp,还是给市场带来了一定的确定性一-至少目前是这样。虽然有人认为这将标志着 Terraform 的终结,但对于企业用户来说,风险规避是最重要的,为了安全,他们不会立即从 IBM 这样的市场巨头这里叛逃。

和去年相比

Terraform 仍然雄踞在王座之上,然而只有 47% 的团队计划未来继续使用 Terraform。显而易见,OpenTofu 的热度急剧上升。不过半数组织并没有考虑使用像 Crossplane 这样的基于 Kubernetes 的 IaC Operator。这个概念在处于早期阶段,至少在加入 Kubernetes 控制器的成本和收益之间得到证实之前,这种思路尚属前途未卜,这也正是对 Kubernetes 包一切的证明过程。

多 IaC 的新常态需要自动化的 CICD

除了多 IaC 之外,多云也处于上涨阶段。86% 的公司运行在多云之上。

根据 Firefly 的用户数据,我们的客户,平均每个租户中有 93 个云账号。这种情况证明了用多账号来简化部门或者项目环境的趋势,但是这种方式进一步提升了对整个组织的成本、透明度以及最佳实践进行管理的难度。

面对着这样的复杂性,手工操作越发难以为继,工具碎片化的问题也更为凸显。这样就要求实践层面做出改变,尤其是面对新的基础设施部署的时候。自动化优先的 Pipeline 自然就成了新的标准。

2025 年,使用 CI/CD 或者 GitOps 流水线进行基础设施交付的比例已经升高到约 59%,成为主流方案。

2024 年,手工本地运行 IaC 的比例是 30%,2026 年,这一比例降低到了 24%。

和去年相比

IaC 自动化流水线得以广泛应用。多云已成事实,但是对多数场景来说,聚焦在两个主要供应商是一个可能的趋势。另外 2025 年,自动化和 GitOps 风格的交付,被受访者认为是 IaC 流水线的首要能力。这表明 DevOps 团队希望能够最小化 IaC 过程中的手工步骤。

漂移管理:从亡羊补牢到料敌机先

2025 年,云治理活动中的配置漂移问题是一个主要的关注点。这个问题在 2024 年是较少被关注的。这是 IaC 的最大优势之一。然而多数从业者依旧冒着放过机会的风险,走在错误的道路上。

目前,主动采取措施(持续监控和自动恢复)面对配置漂移的组织还不到 1/3。其余组织都是被动参与:只有出现问题的时候才发现配置漂移,或者只在某些时候进行一些 ad-hoc 的检查。甚至有 17% 的受访者完全没有偏移检测。这意味着基础设施可能会长期处于未同步的未知状态之中。

发现漂移之后,恢复是比较慢的。40% 的反馈表明需要数天甚至数周来进行修复。2024 年以来,解决速度还是有些改善的,有些组织已经有了偏移检测能力。但是总的说来,仅有约 8% 的用户具备自动修复漂移的能力,手动修复仍是主流。

和去年相比

IaC 的关键能力/优势之一就是更好的漂移管理。从前面的手工修复迁移的数字来看,很多团队还处在被动灭火的阶段。有些组织甚至还没有锁定账号(允许控制台访问)。这种情况表明,尽管了解漂移的危害(和其中的机会),从业者还会牺牲敏捷性来换得控制力。

认可 AI 的潜力,但是采用缓慢

尽管尚未普及,但人工智能正在进入云基础设施管理领域。虽然还只是在早期采用阶段,云从业者也基本认识到人工智能的潜力。那些早期投资的人将具备获得竞争优势的潜力。

约 17% 的团队已经在云运维工作中使用 AI 驱动的能力(例如基于 AI 进行成本优化或者为 IaC 生成代码)。另外 41% 团队正在积极探索或者计划在未来 6 个月内采用 AI 助手。

余下的 42% 没有用 AI 管理基础设施的打算。并且没有团队声明使用完全自主的 AI 管理基础设施。

这种背离表明了行业对 AI 是好奇的,但是还在早期采用阶段,很大程度上,这是一个试验 AI 的阶段。

和去年相比

趋势表明,虽然对于 AI 的兴趣和试验都在增加,然而 AI 尚未在 IaC 工作流程中产生重大影响。在 2024 年,当被问及“人工智能是否影响了您的 IaC 采用和实践?”时,大多数人回答“没有”或“尚未”。到 2025 年:调查将问题重新表述为“您是否使用人工智能功能来控制您的云基础设施?”,14% 的人给出了肯定的回答,当被问及哪些人工智能功能对 IaC 最有价值时,最流行的答案包括自动合规和智能漂移检测。这表明了 AI 可以提供帮助的愿望清单,当然,实际采用还处于萌芽阶段。

2026 展望

根据 2025 年的调研结果,绝大多数公司都有采用 IaC 的意愿,但是因为种种原因,他们无法完全地采用和拥抱 IaC。报告显示 IaC 正在走向成熟,机会多多;但问题也是存在的,例如薄弱的偏移管理和缓慢的 AI 接入,这都影响了推进的速度。Terraform 的统治地位受到威胁。另外自动化优先的流水线是成功的核心要素。

2026 年会怎样?

  • 为了驯服云的复杂性,涌现更多的新方法,可能会出现云供应商的聚焦和自动化水平的提高。

  • Terraform 的市占率在下降,但仍然还是第一名的 IaC 解决方案。IBM 收购,让企业用户更有信心。

  • 不可变基础设施的理念继续发扬光大,这是因为从业者们已经意识到了这一理念在配置偏移场景上的价值。

  • 更多的自动化和 AI 助手,帮助工程师跨越技术壁垒(例如用 AI 发现不合规的 IaC 变更意图,或者识别并纠正配置偏移——像 Firefly 一样)。

More from this blog

龙虾恐慌:AIOps 又要改名了?

ChatGPT 开始,把 AI 拉近到普罗大众的面前,让无数人感受到 AI 的亲民魅力。而龙虾,则把大模型驱动的自动化能力,突然间变得水灵灵、活泼泼地走进千家万户。它不只是“风口上的猪”,而是风口本身。热度高到让 Mac mini 一度断货,不知道这在不在库克的预料之内。 每代人都有每代人的鸡蛋,春节期间,我就领了我的鸡蛋。翻出古老的 MacBook Air M1,充值各种大模型。当然了,这个工具

Mar 9, 20261 min read

再见 2025

我猜不少人以为这个号废了吧?并没有,只是今年变化有点大,一直有种抄起键盘,无从说起的感觉,所以一直偷懒到今天,2025 的最后一天。 今年是我的第四个本命年,去年末一期播客里,大内说本命年不是灾年,是变化年,有危也有机。可是讲真啊,只看到危,没看到机。 各种因缘际会,从鹅厂跳槽到前东家,已经接近四年,第一个合同期已经进入尾声。除了前两年还在云原生领域嗷嗷叫,后两年基本都是些鸡零狗碎的东西了,用老东家的术语说是——偏离主航道,可谓是前景暗淡了。 一旦确定要滚蛋,反倒心思轻松起来,每天骑着我的小红车...

Jan 5, 20261 min read

辅助编程?dora 说:我知道你很急可是请你别急

从 OpenGPT 把大模型的火烧旺了之后,这三年来,相信很多组织或摩拳擦掌、或躬身入局,希望借助聪明能干的大模型,或想偿还技术宅,或想降本增效,或想弯道超车。一时间,沉寂许久的 AIxx 又活过来了,LLM Ops、Vibe Coding、中医大模型、GPT 算命等等,全都老树发新芽,焕发了勃勃生机。那么视角拉回从业者最关注的饭碗相关的领域之一——AI 辅助开发,产生了什么触动,应该如何拥抱呢? DORA 的年度报告中给出了很有意思的结论——强者恒强。 执行摘要部分总结了几个有趣的点: 问题...

Oct 6, 20251 min read

[译]dora:ai 辅助软件开发状态报告

执行摘要 在 2025 年,科技领导者面临的核心问题已不再是“是否要采用 AI”,而是“如何实现其价值”。 DORA 的研究基于超过 100 小时的定性访谈和来自全球近 5,000 名技术专业人士的问卷调查。研究揭示了一个关键事实:AI 在软件开发中的主要角色是“放大器”。它会放大高效能组织的优势,也会凸显组织的缺陷。 关键结论:AI 是放大器 AI 投资的最大回报并非来自工具本身,而是来自组织底层系统的战略性建设: 高质量的内部平台 清晰的工作流 团队的协同能力 缺少这些基础,AI ...

Oct 2, 202514 min read

僭越了,有人在用 Rust 写 Kubernetes

一个新语言问世,最爱做的事情之一,就是重写存量软件了。 云原生喝酒 SIG 重点扶持项目——rk8s(https://github.com/rk8s-dev/rk8s) 也可以归在这个范畴里,只不过这个项目重写的东西比较大,是 Kubernetes。 从 2025 年 1 月第一个 Commit 开始,到现在有了 200 多次 Commit,十几万行代码。当然距离 Kubernetes 的几百万行代码还差得远——老马就是喜欢整这种大无畏项目。 另外该项目也是国内第一个脱离 Cargo 转向使用 ...

Sep 27, 20253 min read

【伪】架构师

342 posts