版本号:v1.4 | 发布时间:2026-04-13 16:05 CST | 调研日期:2026-04-13
更新内容:
- v1.1: 补充 Context Engineer 详细对比分析,新增 Anthropic/Gartner 权威来源
- v1.2: 新增"演进本质:从碎片到系统"章节(从 OpenClaw/Hermes 报告迁移)
- v1.3: 新增"发展时间线"章节(2022-2026关键节点)、"演进驱动力"分析,章节数更新为12章
- v1.4: 新增"一、核心定义"中缺失的 Context Engineer 定义,补全三代技能完整定义
执行摘要
AI 工程技能正在经历三代演进:Prompt Engineering(提示工程)→ Context Engineering(上下文工程)→ Harness Engineering(驾驭工程)。本报告深入对比 Prompt Engineer 与 Harness Engineer 的核心差异,揭示从"单次交互优化"到"系统运营环境设计"的本质跃迁。关键洞察:Harness Engineer 薪资可达 $180K-$200K(Y Combinator/Truewind),核心能力是构建可靠的 Agent 基础设施,让 AI 在生产环境稳定运行。
一、核心定义
Prompt Engineer(提示工程师)
核心问题:"What should be asked?"(应该问什么?)
Prompt Engineering 是 AI 工程化的第一代技能,关注如何构建更好的单次 AI 交互输入。
典型工作:编写优化提示词模板、设计少样本示例(few-shot)、调整提示词格式和语气。
局限性:适用于单轮、有边界的任务;无法扩展到多步骤工作流;不处理系统级可靠性问题。
Context Engineer(上下文工程师)
核心问题:"What context is needed?"(需要什么上下文?)
Context Engineering 是 AI 工程化的第二代技能,关注如何策划和维护 LLM 推理期间的最优上下文信息集合。
典型工作:设计 RAG 系统架构、构建向量数据库、实现记忆管理、集成 MCP 工具、动态组装上下文信息。
关键洞察:Context 决定智能上限。长文本能力让 AI 能够处理完整的业务上下文,将海量业务知识直接注入 Context 实现 In-context Learning。
Harness Engineer(驾驭工程师)
核心问题:"How should the whole environment be designed?"(整个环境应该如何设计?)
Harness Engineering 是 AI 工程化的第三代技能,关注构建和管理编排多个 AI Agent 会话的基础设施。
典型工作:设计多 Agent 编排架构、构建任务分配系统、实现输出验证和失败处理、设计反馈循环、管理权限和安全边界。
"This is not prompt engineering. This is making AI work in production."
— Y Combinator / Truewind 招聘要求
二、三代 AI 工程技能演进
| 代际 | 名称 | 时期 | 核心关注点 | 类比 |
|---|---|---|---|---|
| 第一代 | Prompt Engineering | 2022-2024 | 单次交互输入优化 | 知道怎么跟皇帝说话的外交官 |
| 第二代 | Context Engineering | 2025 | 上下文窗口信息管理 | 给外交官准备完整情报包的参谋长 |
| 第三代 | Harness Engineering | 2025-现在 | 完整运营环境设计 | 设计外交使团运作体系的国务卿 |
2.1 关注点层级
关系:不是替代,而是嵌套包含。优秀的 Harness Engineer 必然也是出色的 Context Engineer 和 Prompt Engineer。
2.2 演进本质:从碎片到系统
1、Prompt Engineering:碎片化的 NLP 交互
核心特征:关注单次、碎片化的自然语言指令,适用于简单、有边界的任务场景。
局限性:无法承载复杂业务系统的完整意图;每次交互都是独立上下文,信息容易丢失;难以处理多步骤、长周期的研发任务。
2、Context Engineering:复杂系统拆解出的完整意图文档
核心特征:将复杂业务系统拆解为结构化的 Context 文档,包含背景、目标、设计、验证、安全、风险等完整的意图表达。
关键实践:
- Context 决定智能上限:长文本能力让 AI 能够处理完整的业务上下文
- In-context Learning:将海量业务知识直接放入 Context,AI 在语境中学习
- Context, not Control:特性负责人从"进度监工"转型为"Context 守护者"
3、Harness Engineering:复杂业务系统的约束与 AI 系统设计约束
核心特征:关注复杂业务系统的整体约束设计,AI 系统设计的工程化约束(架构边界、依赖规则、质量标准)。
关键数据(OpenAI 实验成果):
| 指标 | 数据 | 说明 |
|---|---|---|
| 开发周期 | 5个月 | 从零到完整产品上线 |
| 团队规模 | 3人 → 7人 | 后期扩展后效率反而提升 |
| 代码规模 | ~100万行 | 涵盖应用逻辑、测试、CI、文档 |
| 手写代码 | 0行 | 全部由 Codex Agent 生成 |
| 效率提升 | ~10倍 | 相比传统开发模式 |
2.3 发展时间线
2022年11月 — ChatGPT 发布,Prompt Engineering 诞生
OpenAI 发布 ChatGPT,用户发现通过精心设计提示词可以显著提升 AI 输出质量,"Prompt Engineering"概念开始流行。
2023年 — Prompt Engineering 黄金时代
- 提示词工程成为热门技能,大量提示词技巧和框架涌现(Chain-of-Thought、Few-shot、Role Prompting)
- 首批 "Prompt Engineer" 职位出现,薪资 $80K-$150K
- 局限性暴露:单轮交互无法处理复杂任务
2024年初 — RAG 技术普及,Context 意识觉醒
检索增强生成(RAG)成为主流方案,业界开始关注"上下文管理"的重要性,Context Engineering 概念萌芽。
2024年6月 — Andrej Karpathy 提出 Context Engineering
前 Tesla AI 总监 Andrej Karpathy 在社交媒体表示:"The hottest new programming language is English... context engineering (not prompt engineering) is the core skill",引发行业关注。
2024年11月 — Anthropic 官方定义 Context Engineering
Anthropic 发布官方文档,将 Context Engineering 定义为"strategies for curating and maintaining the optimal set of tokens during LLM inference"。
2025年初 — Multi-Agent 系统兴起
LangGraph、CrewAI 等多 Agent 编排框架发布,单一 Prompt 已无法满足复杂工作流需求。
2025年3月 — Harness Engineering 概念提出
MindStudio 博客文章《What Is Harness Engineering?》首次系统提出 Harness Engineering 概念,定义为第三代 AI 工程技能。
2025年6月 — 行业领袖集体背书
- Shopify CEO Tobi Lütke: "Context engineering describes the core skill better"
- Gartner 将 Context Engineering 纳入企业 AI 实施指南
2026年3月 — Harness Engineer 职位正式出现
Y Combinator 公司 Truewind 发布 Harness Engineer 招聘,薪资 $180K-$200K,标志第三代技能正式职业化。
2026年4月 — 概念体系成熟
三代 AI 工程技能演进框架(Prompt → Context → Harness)成为行业共识,教育体系开始跟进。
2.4 演进驱动力
| 阶段 | 驱动力 | 技术突破 |
|---|---|---|
| Prompt Engineering | ChatGPT 交互优化需求 | InstructGPT、RLHF |
| Context Engineering | 长上下文窗口、RAG 普及 | Claude 100K/200K、向量数据库 |
| Harness Engineering | Multi-Agent 系统、生产级 AI 需求 | LangGraph、AutoGen、MCP |
三、工作内容对比
| 维度 | Prompt Engineer | Context Engineer | Harness Engineer |
|---|---|---|---|
| 核心任务 | 编写优化提示词 | 设计和维护上下文信息系统 | 构建 Agent 运营基础设施 |
| 关注范围 | 单次交互 | 上下文窗口信息管理 | 多步骤工作流系统 |
| 核心问题 | "What should be asked?" | "What context is needed?" | "How should the environment be designed?" |
| 技术栈 | 提示词模板、Few-shot | RAG、向量数据库、MCP、记忆架构 | 编排框架、验证系统、权限管理 |
| 关键技能 | 提示词设计、示例工程 | 信息检索、上下文组装、工具集成 | 系统架构、约束设计、反馈循环 |
| 可靠性 | 依赖模型输出质量 | 依赖上下文准确性和完整性 | 设计约束、重试、回滚机制 |
| 可观测性 | 较少涉及 | 上下文追踪、来源验证 | 全程日志、追踪、监控 |
| 失败处理 | 手动调整提示词 | 动态上下文刷新、降级检索 | 自动重试、降级、人工介入 |
Context Engineer 核心职责详解
根据 Anthropic 2025年9月官方文档,Context Engineering 是"strategies for curating and maintaining the optimal set of tokens during LLM inference"(策划和维护 LLM 推理期间最优 token 集合的策略)。
具体工作:
- RAG 系统构建:设计检索增强生成架构,连接外部知识库
- 上下文组装:整合系统指令、历史对话、外部数据、工具输出
- 记忆架构设计:实现持久化记忆和短期会话管理
- MCP 集成:使用 Model Context Protocol 连接外部工具和数据源
- 动态上下文交付:基于当前任务动态获取和注入上下文信息
"Context engineering describes the core skill better: the art of providing all the context for the task to be plausibly solvable by the LLM."
— Tobi Lütke, Shopify CEO, June 2025
"The hottest new programming language is English... in every serious LLM application, 'context engineering' (not prompt engineering) is the core skill."
— Andrej Karpathy, AI Researcher, June 2025
四、汽车行业类比
| 角色 | 汽车类比 | 核心职责 |
|---|---|---|
| LLM 研究员 | 发动机研发工程师 | 研究、开发、优化基础模型 |
| Prompt Engineer | 方向盘与油门刹车的校准工程师 | 设计、优化、评估 Prompt,控制交互方式 |
| Context Engineer | 车载信息导航系统工程师 | 整合 GPS、路况、地图数据,为驾驶决策提供完整信息支持 |
| AI 算法工程师 | 自动驾驶算法研发工程师 | 研究推理链(ReAct、CoT、ToT) |
| DevOps 工程师 | 运维工程师 | 部署、维护全生命周期管理平台 |
| Harness Engineer | 整车工程设施与流程架构师 | 设计图纸审核、发动机选型调试、外部设备安装适配、碰撞测试、实时监控维护 |
关键洞察:
- Prompt Engineer 负责控制逻辑的校准(怎么开)
- Context Engineer 负责信息环境的构建(往哪开、基于什么信息决策)
- Harness Engineer 负责全套汽车工程设施与流程(整体系统如何协同工作)
五、Harness Engineer 的核心能力
1. 构建可靠的 Agent 基础设施
根据 Y Combinator 公司 Truewind 的 Harness Engineer 招聘要求:
具体工作:
- 构建执行多步骤工作流的 Agent
- 设计验证、重试和失败处理系统
- 定义约束(schemas、invariants、contracts)
- 添加反馈循环(detect → debug → improve)
- 将失败转化为可复用系统
2. 技术能力要求
| 能力 | 说明 |
|---|---|
| 系统思维 | 设计复杂系统的整体架构 |
| 基础设施经验 | 后端、数据系统、开发者工具 |
| 可靠性工程 | 构建可靠系统(不只是功能) |
| 调试能力 | 调试复杂、模糊的问题 |
| 约束设计 | 思考约束、不变量、反馈循环 |
重要提示:仅 LLM 经验不够,关键是如何让系统可靠。
六、薪资参考
Y Combinator / Truewind Harness Engineer 招聘:
- 薪资范围:$180K - $200K
- 股权:0.10% - 0.25%
- 发布时间:2026年3月30日
七、入门建议
1. 从 Claude Code Hooks 开始(最低成本)
# 在项目里创建 .claude/settings.json
mkdir -p .claude
touch .claude/settings.json
简单 Hooks 示例:
- 每次写文件后自动格式化
- 每次执行命令前打印日志
- 每次对话结束后自动保存摘要
2. 研究真实 Agent 框架
- LangGraph:关注有状态、多步骤 Agent 工作流
- CrewAI:多 Agent 角色协作框架
- Hermes Agent:模块化多代理框架
- OpenClaw:个人 AI 助手平台
八、总结
| 维度 | Prompt Engineer | Context Engineer | Harness Engineer |
|---|---|---|---|
| 核心问题 | 应该问什么? | 需要提供什么上下文? | 整个环境如何设计? |
| 关注层级 | 单次交互 | 信息级上下文管理 | 系统级运营 |
| 关键技能 | 提示词编写、Few-shot | RAG、记忆架构、MCP、信息组装 | 编排架构、约束设计、反馈循环 |
| 技术重点 | 提示模板、示例工程 | 向量检索、工具集成、上下文压缩 | 多 Agent 编排、验证系统、权限管理 |
| 可靠性 | 依赖模型 | 依赖信息质量和检索准确性 | 系统设计保障 |
| 思维模式 | 对话伙伴 | 信息架构师 | 系统设计师 |
| 价值产出 | 更好的单次输出 | 更准确、更相关的 AI 响应 | 可靠的自主工作系统 |
| 代表时期 | 2022-2024 | 2024-2025 | 2025-现在 |
演进本质:我们与 AI 的关系正在从"对话伙伴"演进到"系统设计师"。这不仅是技术演进,更是思维框架的跃迁。
"Context engineering is the art and science of curating what will go into the limited context window from that constantly evolving universe of possible information."
— Anthropic, September 2025
权威来源与引用
来源:MindStudio AI 博客
网址:https://www.mindstudio.ai/blog/what-is-harness-engineering-beyond-prompt-context-engineering/
时间:2026年4月9日
核心观点:提出三代 AI 工程技能演进框架:Prompt → Context → Harness Engineering
来源:Anthropic 官方工程博客
网址:https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
时间:2025年9月29日
核心观点:Context Engineering 是"strategies for curating and maintaining the optimal set of tokens during LLM inference",是 Prompt Engineering 的自然演进
来源:Tobi Lütke (Shopify CEO) Twitter / Andrej Karpathy
时间:2025年6月
核心观点:
- Tobi Lütke: "Context engineering describes the core skill better: the art of providing all the context for the task to be plausibly solvable by the LLM"
- Andrej Karpathy: "The hottest new programming language is English... context engineering (not prompt engineering) is the core skill"
来源:Packmind AI 博客
网址:https://packmind.com/context-engineering-ai-coding/what-is-context-engineering/
时间:2026年1月22日
核心观点:Context engineering is "the practice of designing systems that decide what information an AI model sees before generating a response"
来源:Gartner Research
时间:2025年
核心观点:Context engineering is "designing and structuring the relevant data, workflows and environment so AI systems can understand intent, make better decisions and deliver contextual, enterprise-aligned outcomes — without relying on manual prompts"
来源:Intuition Labs
网址:https://intuitionlabs.ai/articles/what-is-context-engineering
时间:2026年2月27日
核心观点:40% 的 AI 项目失败源于上下文输入不佳,Context Engineering 是解决这一问题的关键
来源:Y Combinator 公司 Truewind 官方招聘
网址:https://www.ycombinator.com/companies/truewind/jobs/xMIZCn0-harness-engineer-ai-agent-systems
时间:2026年3月30日
薪资范围:$180K - $200K + 0.10% - 0.25% 股权
来源:学术论文
网址:https://arxiv.org/html/2604.04258v1
时间:2026年4月5日
核心观点:提出 Context Engineering 的形式化方法论,包含角色分类、冲突解决和序列化工作流程