2025年DORA报告核心发现
AI辅助软件开发状态报告
执行摘要
核心观点:AI是一个放大器
2025年,技术领导者面临的核心问题已不再是"是否"应该采纳AI,而是"如何"实现其价值。DORA的研究揭示了一个关键事实:AI在软件开发中的主要角色是一个放大器。它能放大高效能组织的优势,也能放大表现不佳组织的弊病。
AI投资的最大回报并非来自工具本身,而是源于对底层组织系统的战略性关注:高质量的内部平台、清晰的工作流程、团队的协同能力。缺少这些基础,AI只能创造局部的生产力提升,而这些提升往往会因下游的混乱而白费。
关键数据概览
五大主要发现
AI会放大组织已有的优势和劣势。对于拥有坚实基础的高绩效团队,AI是强大的加速器;而对于深陷技术债务、流程混乱的团队,AI只会帮助他们更快地生成问题。
95%的受访者现在依赖AI,超过80%的人认为它提高了生产力。但仍有30%的人表示对AI生成的代码几乎没有信任,这表明"验证与批判性能力"仍然关键。
与去年相比,采用AI技术的确提升了软件交付的吞吐量,但同时也降低了交付的稳定性。这意味着团队正在加速,但底层系统尚未能应对这样的交付效率。
研究识别了七种不同的团队类型,从"和谐的高成就者"到被"遗留系统瓶颈"困住的团队,为定向改进提供了新框架。
90%的组织已采用平台工程,高质量的平台成为AI落地的必由之路。没有统一平台的AI工具只会加剧"工具碎片化"和"协作割裂"。
AI采用现状
AI普及程度:无处不在
AI已不再只是早期采用者的小众工具。根据DORA 2025年的调研,90%的技术专业人士现在在工作中使用AI。AI已成为开发者日常工作中的固定伙伴:
- 用户每天花2小时与AI协作
- 在遇到障碍时,约一半时间会求助于AI
- 65%的人在工作中至少"一定程度上"依赖AI
AI在不同任务中的使用率
| 任务类型 | 使用AI的比例 |
|---|---|
| 编写新代码 | 71% |
| 修改现有代码 | 66% |
| 编写文档 | 64% |
| 创建测试用例 | 62% |
| 解释概念 | 62% |
| 分析数据 | 61% |
| 调试 | 59% |
| 代码审查 | 56% |
信任悖论:生产力提升 vs 信任缺失
矛盾现象:超过80%的用户报告AI显著提升了生产力,但30%的受访者对AI生成的代码几乎没有信任。
这不是失败的标志,而是成熟度的体现。开发者并非盲目接受AI的输出,而是将其视为一个聪明但可能出错的"初级伙伴",应用他们多年来对Stack Overflow或开源库养成的"信任但验证"的怀疑态度。
DORA指出:
"讨论必须从'采用'转向'有效使用'。你的培训项目应该专注于教导团队如何批判性地指导、评估和验证AI生成的工作,而不是仅仅鼓励使用。"
速度与稳定性的博弈
2024年,DORA首次正式研究AI时,发现了一个悖论:
"大约75%的人表示在工作中使用AI,并认为AI让他们更有生产力。然而,同样的调查显示AI对吞吐量、稳定性和有价值工作的时间产生了负面影响。"
2025年的数据提供了关键更新:AI采用现在与软件交付吞吐量呈明显正相关——团队正在成功利用AI来编写和发布代码。然而,这种加速是有代价的。
报告发现,AI采用继续与更高的不稳定性相关,导致更多的变更失败、增加的返工和更长的解决问题周期。
DORA估计,在具有相同特质、环境和流程的两个人中,AI采用率更高的人将报告:
- ✅ 更高水平的个人效能
- ✅ 更高水平的组织绩效
- ✅ 更高比例的宝贵工作时间
- ✅ 更高水平的代码质量
- ✅ 更高水平的软件交付吞吐量
- ⚠️ 更高水平的软件交付不稳定性
- ➖ 相似水平的倦怠感
- ➖ 相似水平的摩擦感
七类团队画像
简单的指标已不足够。DORA 2025确定了七种截然不同的团队画像,每种都具有独特的绩效、稳定性和幸福感组合。这个模型提供了一种细致入微的方式来理解团队的具体挑战,并创建量身定制的改进路径。
各类团队特征
1. 基础性挑战团队 (Foundational Challenges)
这些团队被困在"生存模式"中,在流程、环境和成果上存在根本性缺陷。效能指标持续处于低水平,成员普遍报告存在较高程度的倦怠感,系统稳定性面临显著挑战。这类团队不需要AI,他们需要重启。
2. 遗留瓶颈团队 (The Legacy Bottleneck)
处于这一类群的团队始终处于被动应对状态,不稳定的系统支配着他们的工作。虽然能够定期交付更新,但持续存在的质量问题削弱了实际创造的价值。团队成员反馈存在较高程度的摩擦与倦怠感。
3. 流程约束团队 (Process-Constrained)
团队知道该做什么,但审批、政策和会议扼杀了所有动力。流程成了创新的阻碍而非保障。
4. 高影响低节奏团队 (High-Impact, Low-Cadence)
产出质量高,但交付速度慢。通常人手不足或过度专业化。AI可以在这里发挥作用,但需要谨慎。
5. 稳定而审慎团队 (Stable and Methodical)
质量优先的团队。冷静、可靠……有时对现代产品需求来说太慢。AI可以帮助他们在不牺牲质量的情况下加速。
6. 务实高绩效者 (Pragmatic Performers)
速度与稳定性的健康平衡。如果这些团队很好地采用AI,他们可以攀升到顶级。这是AI投资的甜蜜点。
7. 和谐高成就者 (Harmonious High Achievers)
低压力、高稳定性、快速交付、优秀文化——这是团队的圣杯。AI在这里可以让他们变得不可阻挡。
好消息
近40%的团队属于第6类和第7类(务实高绩效者 + 和谐高成就者),这意味着"AI革命"并非精英专属——它是可实现的。
DORA AI能力模型
DORA提出了新的AI能力模型,识别了七个基础实践。当团队将这些能力与AI采用相结合时,AI在重要结果上的积极影响会被进一步放大。
七大核心AI能力
人们知道何时以及如何安全地使用AI。组织需要有明确的AI政策和治理框架。
将工作拆分为小块,便于快速验证和迭代。这是DevOps的核心实践,在AI时代更加重要。
高质量、可访问、一致性的内部数据,直接决定AI能否从"聪明玩具"变成"业务助手"。
开发者体验流畅,工具不会成为阻碍。平台工程是AI成功应用的关键基础。
数据分散在多个孤岛、质量参差不齐时,AI再强也只能生成"看起来聪明但不可信"的回答。
交付只有在解决真正的问题时才重要。价值流管理确保AI被应用于正确的问题。
强大的版本控制是协作的基础,也是AI辅助开发中追溯和审查的保障。
能力建设建议
"AI的成功应用不是工具问题——而是系统问题。这七大能力应该成为CTO的必读书目。"
DORA建议组织:
- 先修复系统——稳定的流水线、清晰的架构、扎实的产品发现
- 逐步采用AI并建立反馈循环——从小处开始,测量一切,持续调整
- 大力投资于人才——培训、结对编程、新工作流程和心理安全
平台工程与价值流管理
平台工程:AI的基础设施
平台工程现已几乎普及——94%的组织已采用平台工程,90%拥有专职平台团队。数据显示,高质量内部平台与组织释放AI价值的能力之间存在直接关联。
核心洞察:将平台视为旨在改善开发者体验(Developer Experience)的内部产品的组织,将获得显著更高的AI投资回报。
对管理层来说,这意味着:
- 如果没有统一的内部开发者平台,AI工具只会进一步加剧"工具碎片化"和"协作割裂"
- 糟糕的开发者体验和零散的工具可能会阻碍AI战略产生影响
- 应该优先投资并资助平台工程计划
价值流管理:AI的倍增器
价值流管理(Value Stream Management, VSM)通过可视化、分析和改进从创意到客户的工作流,成为AI的倍增器。它确保局部的效率提升,能够真正地增进产品质量和团队效能。
- VSM推动团队效能:持续审视和改进价值流的团队报告的绩效显著更高
- VSM带来更有价值的工作:这些团队在组织及其客户真正关心的工作上投入的时间明显更多
- VSM改善产品效能:对价值流的关注转化为更好的产品成果
DORA的研究证实了以下假设:
"VSM将AI转化为组织优势。具备成熟VSM实践的团队能够把AI带来的生产力提升引导至解决系统层面的问题,从而确保个体改进能够转化为更广泛的组织成功。而如果缺乏VSM,AI的作用就可能仅限于局部效率的提升,而这些提升最终会被下游的瓶颈所吞噬。"
行动建议
给工程领导者的建议
AI与工作摩擦和职业倦怠的改善几乎没有显著相关性。这些问题需要的是决策机制调整、权限划分与流程重构,而不是一个更聪明的编辑器。
如果只看到AI带来的"提速",却忽略了不稳定性与隐性风险的叠加,很容易在一年后迎来一波"质量与运维事故的反噬"。
把AI项目的预算单独拎出来讨论往往是陷阱。更务实的做法,是把平台工程建设、内部数据治理、AI能力接入与治理,视为同一个"AI研发效能基础设施项目"的三个侧面。
与运营模式深度绑定——永远不要急于求成。培训项目应该专注于教导团队如何批判性地指导、评估和验证AI生成的工作。
实施路线图
| 阶段 | 行动项 | 预期成果 |
|---|---|---|
| 第一阶段 (0-3个月) |
|
清晰的现状认知和治理框架 |
| 第二阶段 (3-6个月) |
|
坚实的基础设施和小范围成功 |
| 第三阶段 (6-12个月) |
|
组织级的效能提升 |
参考资料
名词解释
DevOps Research and Assessment的缩写,是Google Cloud旗下的一个长期研究项目,旨在研究推动软件交付和运营绩效的能力。DORA每年发布的报告被视为DevOps领域的权威研究。
指在软件开发生命周期中使用人工智能技术来辅助完成各种任务,包括代码生成、代码审查、测试生成、文档编写、调试等。2025年DORA报告将主题从传统的DevOps研究转向这一新兴领域。
衡量团队交付软件变更速度和频率的指标,通常包括部署频率和变更交付周期。高吞吐量意味着团队能够快速、频繁地将代码变更部署到生产环境。
反映软件交付过程中出现问题的频率和严重程度的指标,通常通过变更失败率和失败恢复时间来衡量。高不稳定性意味着频繁的故障和更长的修复时间。
通过可视化、分析和改进从创意到客户的工作流,确保组织的资源投入到最有价值的活动中。VSM被DORA 2025确认为AI投资的倍增器。
构建和运营内部开发者平台的方法论,旨在通过提供标准化的自助服务基础设施和工具来改善开发者体验(Developer Experience)。2025年报告显示90%的组织已采用平台工程。
开发者在使用工具、流程和系统完成工作时的整体体验。良好的开发者体验是高效软件交付的重要基础,也是AI成功应用的关键因素。
指2025年DORA报告发现的现象:虽然80%以上用户认为AI提高了生产力,但30%的人对AI生成的代码几乎没有信任。这反映了开发者的成熟态度——"信任但验证"。
DORA四大核心指标之一,衡量导致生产故障或需要修复的变更百分比。低变更失败率表明高质量的交付实践。
DORA四大核心指标之一,衡量从代码提交到代码成功运行在生产环境所需的时间。短交付周期意味着团队能够快速响应需求变化。
DORA四大核心指标之一,衡量从生产故障发生到恢复正常服务所需的时间。短恢复时间表明团队具备强大的事故响应能力。
由长期工作压力导致的身心疲惫状态。DORA 2025报告发现AI采用与工作摩擦和职业倦怠的改善几乎没有显著相关性,说明这些是组织结构性问题而非工具问题。