AiDD研发数字峰会 — 北京站Agent编程道场

Agent编程道场
8月23日

DEEP WORKSHOP
(限30人)

朱少民

《软件工程 3.0》作者/CCF 杰出会员/AiDD 技术委员会成员

同济大学特聘教授、CCF杰出会员、软件绿色联盟标准评测组组长，近三十年来一直从事软件测试、质量管理等工作，先后获得多项省、部级科技进步奖，已出版了二十多部著作和4本译作，代表作主要有《软件工程3.0》、《软件测试方法和技术》、《全程软件测试》、《敏捷测试》等，并经常在国内外学术会议或技术大会上发表演讲，曾任思科（中国）软件有限公司QA高级总监、IEEE ICST2019工业论坛主席、IEEE ICST、QRS、DAS等国际学术会议的程序委员、《软件学报》审稿人等。

课程时间：1天（6小时，含1小时午餐+休息）
课程形式：理论 + 案例分析 + 小组实战
人数规模：20-30人/班

🎓 课程介绍：

为什么你需要这门课？
AI coding，已经从"vibe coding "走向"严肃工程——Spec Driven Development "，开始采用OpenClaw、OpenCode、Hermes Agent等智能体编程框架，但是企业惊讶地发现：最强的模型，配上垃圾的系统设计，照样频繁翻车，代码生成Agent成功率低、Agent权限逃逸等。

问题不在模型，在系统。传统的做法是"优化Prompt"，但这只能解决表面问题。真正的解决方案是"用软件工程思维设计系统"——这就是Harness工程。

课程设计哲学 (五大核心原则)
1) 系统优于模型：同一个模型，用了Harness和没用的可靠性相差10倍以上
2) 约束即自由：清晰的约束边界让Agent更安全地自动化，真正的自由度反而提升
3) 失败可预测：不是"防止所有失败"，而是"失败时自动分流和恢复"
4) 架构即规范：把工程经验写成SKILLs、写成流程，构建知识图谱，而不是依赖"某个高手"
5) 可验证即可信 — 系统的每个决策都要能追踪、复现、改进
换个角度理解：这不是"让AI更聪明"的课，而是"让AI的工作更有序、更可靠"的课，这就是Harness工程的核心。学完这门课，你会明白：真正的AI工程师，不是和模型对话的人，而是设计系统架构、让模型有序工作的人。

📋 课程目标与收益

1) 理解为什么Agent系统频繁翻车——从"模型更聪明"转向"系统更可靠"
2) 掌握Harness工程的核心架构（5层控制体系+ Context工程+ 权限治理）
3) 设计完整的失败恢复机制与权限管理规范，获得可复用的Harness设计模板
4) 建立ATDD验收驱动测试体系（快速识别可靠性）
5) 制定回到团队的3个月行动计划，并能帮助团队显著提升Agent系统成功率、降低线上故障率等。

🎯 课程特色

核心差异：这不是"如何优化Prompt"，而是"如何在系统层面设计，让失败自动恢复"

👥 课程对象

• AI工程师、软件开发工程师 - 核心学员，可直接落地设计
• 研发负责人/Technical Lead - 制度化推行的关键角色
• QA/测试工程师 - 理解工程约束与权衡，ATDD验收体系设计
• 创业/创新团队 - 快速积累最佳实践

📚 课程内容

（中间回穿插小组讨论和实操）

上午：模块1：Harness工程的系统认知与5层架构

Part A：问题诊断与架构导入
• 失败根源分析：基于Agent的研发系统为什么频繁翻车？
• 案例分析：3个典型失败的Harness诊断
• Harness的定义：Model（模型）+ Harness（工程体系）= 可靠系统

Part B：Harness 5层控制体系
• 第1层：控制平面 - Prompt分层与指令优先级
• 第2层：Query Loop - "心跳"设计与重试策略
• 第3层：工具调度与权限治理 – 门禁设计
• 第4层：上下文治理 - Context压缩与恢复规则
• 第5层：错误恢复 - "失败 =主路径"的设计哲学
• 如何设计从需求到代码生成、交付验证的E2E控制链路

下午：模块2 和模块3

模块2：Context工程与权限治理

Part C：Context工程基础
• 分层CLAUDE.md的架构（系统级 + 工程级 + 业务级）
• Agentic RAG在长期对话中的应用
• Context压缩与内存预算管理
• 工程约束规范化：从 "建议" 变成 "代码"

Part D：权限治理与失败分类
• 四大失败模式识别（权限逃逸、工具失败、理解错误、上下文膨胀）
• 权限的分层设计：Allow / Deny / Ask / Escalate
• 危险工具的高密度约束规范
• 失败分类表的标准化（10+ 类型 + 自动恢复规则）
• 失败模式 → 对应门禁 → 对应恢复策略
• 审计链路：从输入到决策到工具调用

模块3：ATDD验收驱动测试

Part E：ATDD验收体系
• 从手工测试到ATDD的转变
• 15+ 关键工程用例库设计（Gherkin格式）
• 验证分离的必要性：为什么Agent不能自己给自己打分？
• ATDD用例如何覆盖 Query Loop 与恢复分支
• 用例覆盖率与质量指标

Part F：实战演练与复盘
• 分组设计：选择一个真实场景的、以代码生成/代码修改/PR提交链路为主的Agent系统案例
• 小组完整设计输出：3层次Context设计 + 3个SKILLs + 多个门禁
• 讲师评审与改进建议
• 未来90天行动计划制定

让智能体自主编程不翻车：
从 Context 工程到 Harness 设计的工程实践

维度
哲学	设计环境，让Agent在安全边界内工作
关注点	系统工程可靠性
成功标准	长期无故障运行 + 自我修复能力
失败处理	自动分流、智能恢复、可追踪
收益周期	3个月内明显（ROI高）