Harness Engineering:AI时代软件工程的范式转移
OpenAI实验揭秘:3人5个月交付100万行代码,0手写,10倍效率提升
OpenAI实验揭秘:3人5个月交付100万行代码,0手写,10倍效率提升
| 指标 | 数据 | 说明 |
|---|---|---|
| 开发周期 | 5个月 | 从零到完整产品上线 |
| 团队规模 | 3人 → 7人 | 后期扩展后效率反而提升 |
| 代码规模 | ~100万行 | 涵盖应用逻辑、测试、CI、文档 |
| 手写代码 | 0行 | 全部由Codex Agent生成 |
| PR数量 | ~1,500个 | 约1,500个Pull Request |
| 人均日处理PR | 3.5个 | 工程师日均审核3.5个PR |
| 效率提升 | ~10倍 | 相比传统开发模式 |
"我们目前最困难的挑战,集中在设计环境、反馈回路和控制系统上。"
—— Ryan Lopopolo, OpenAI技术团队成员
Harness 一词有两层含义:一是"挽具"(套在马身上的缰绳和鞍具),二是"驾驭"。这个词同时说清了两件事:Agent是干活的马,工程师是造缰绳的人。
人设计环境驾驭AI
AI在这套环境中自主完成开发任务
设计工程环境与架构约束
明确意图与任务规范
构建自动化反馈与验证闭环
在约束环境内自主编码
自动生成测试与文档
自我迭代直到满足验收标准
不同于传统README给人看,AGENTS.md专门描述项目架构、规范、工作流程,是AI的"入职手册"。OpenAI的实验连第一版AGENTS.md都是由Codex自己写的。
依赖方向强制单向流动,由CI自动验证:
Types → Config → Repo → Service → Runtime → UI
如果Agent写了UI代码直接调用Repo层,CI直接报错,PR过不了。
把团队的"代码品味"编码成自动化检查规则。例如:禁止重复创建辅助函数,强制通过Provider接口引入横切关注点(认证、日志等)。
部署专门的Agent夜间运行,清理无用代码、过时文档、不一致的命名规范——对抗技术债务的"熵增"。
日志、指标、追踪全部对AI开放,让它能自我诊断、定位问题、自主修复。
| 维度 | 传统模式 | Harness模式 |
|---|---|---|
| 核心工作 | 编写代码 | 设计环境、架构、约束 |
| 与代码关系 | 直接创造 | 通过规则间接塑造 |
| 与AI关系 | 工具使用者 | 环境设计者 |
| 技能重点 | 语法、算法、框架 | 系统思维、抽象设计、质量标准 |
"软件工程师由'写代码'转成'为AI定制项目脚手架'"
—— 和度软件《软件逻辑地图》
原始来源:OpenAI官方博客,2026年2月发布,作者Ryan Lopopolo(OpenAI技术团队成员)。
行业认可:
Harness Engineering不是"AI取代程序员"的噱头,而是"程序员角色升级"的实证案例。当AI可以睡觉时产出3.5个PR,当100万行代码可以由3名工程师"监督"完成,传统软件工程师的价值主张必须重新定义——从"写代码的人"变成"设计系统的人"。
Harness engineering: leveraging Codex in an agent-first world
作者:Ryan Lopopolo | 2026年2月
软件工程大师对Harness Engineering的解读与思考
🔗 https://martinfowler.com/articles/exploring-gen-ai/harness-engineering.html
OpenAI提出Harness Engineering概念,工程师角色转向系统设计而非直接编码
《Harness Engineering:当人类不再写代码,软件工程反而更"工程"了》
OpenAI推出的AI编程助手套件,能够理解代码库上下文并自主完成开发任务。
智能体,具备一定自主决策能力的AI程序,可以在给定目标下自主规划并执行一系列动作。
代码静态分析工具,用于检查代码是否符合预定义的编码规范和最佳实践。
代码合并请求,是团队协作开发中用于代码审查和合并的工作流程。
专门给AI智能体阅读的项目文档,描述项目架构、规范和工作流程。
"向进度落后的软件项目增加人手,只会使其更加落后。"Harness Engineering打破了这一法则——团队扩大后效率反而提升。