Agent编程道场
8月23日 
DEEP WORKSHOP
(限30人)
朱少民
《软件工程 3.0》作者/CCF 杰出会员/AiDD 技术委员会成员 
同济大学特聘教授、CCF杰出会员、软件绿色联盟标准评测组组长,近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和4本译作,代表作主要有《软件工程3.0》、《软件测试方法和技术》、《全程软件测试》、《敏捷测试》等,并经常在国内外学术会议或技术大会上发表演讲,曾任思科(中国)软件有限公司QA高级总监、IEEE ICST2019工业论坛主席、IEEE ICST、QRS、DAS等国际学术会议的程序委员、《软件学报》审稿人等。
课程时间:1天(6小时,含1小时午餐+休息)
课程形式:理论 + 案例分析 + 小组实战
人数规模:20-30人/班


🎓 课程介绍:

为什么你需要这门课?
AI coding,已经从"vibe coding "走向"严肃工程——Spec Driven Development ",开始采用OpenClaw、OpenCode、Hermes Agent等智能体编程框架,但是企业惊讶地发现:最强的模型,配上垃圾的系统设计,照样频繁翻车,代码生成Agent成功率低、Agent权限逃逸等。

问题不在模型,在系统。传统的做法是"优化Prompt",但这只能解决表面问题。真正的解决方案是"用软件工程思维设计系统"——这就是Harness工程。


课程设计哲学 (五大核心原则)

1) 系统优于模型:同一个模型,用了Harness和没用的可靠性相差10倍以上
2) 约束即自由:清晰的约束边界让Agent更安全地自动化,真正的自由度反而提升
3) 失败可预测:不是"防止所有失败",而是"失败时自动分流和恢复"
4) 架构即规范:把工程经验写成SKILLs、写成流程,构建知识图谱,而不是依赖"某个高手"
5) 可验证即可信 — 系统的每个决策都要能追踪、复现、改进
换个角度理解:这不是"让AI更聪明"的课,而是"让AI的工作更有序、更可靠"的课,这就是Harness工程的核心。学完这门课,你会明白:真正的AI工程师,不是和模型对话的人,而是设计系统架构、让模型有序工作的人。


📋 课程目标与收益

1) 理解为什么Agent系统频繁翻车——从"模型更聪明"转向"系统更可靠"
2) 掌握Harness工程的核心架构(5层控制体系+ Context工程+ 权限治理)
3) 设计完整的失败恢复机制与权限管理规范,获得可复用的Harness设计模板
4) 建立ATDD验收驱动测试体系(快速识别可靠性)
5) 制定回到团队的3个月行动计划,并能帮助团队显著提升Agent系统成功率、降低线上故障率等。


🎯 课程特色















核心差异:这不是"如何优化Prompt",而是"如何在系统层面设计,让失败自动恢复"


👥 课程对象

AI工程师、软件开发工程师 - 核心学员,可直接落地设计
研发负责人/Technical Lead - 制度化推行的关键角色
QA/测试工程师 - 理解工程约束与权衡,ATDD验收体系设计
创业/创新团队 - 快速积累最佳实践


📚 课程内容

(中间回穿插小组讨论和实操)

上午:模块1:Harness工程的系统认知与5层架构

Part A:问题诊断与架构导入

• 失败根源分析:基于Agent的研发系统为什么频繁翻车?
• 案例分析:3个典型失败的Harness诊断
• Harness的定义:Model(模型)+ Harness(工程体系)= 可靠系统

Part B:Harness 5层控制体系

• 第1层:控制平面 - Prompt分层与指令优先级
• 第2层:Query Loop - "心跳"设计与重试策略
• 第3层:工具调度与权限治理 – 门禁设计
• 第4层:上下文治理 - Context压缩与恢复规则
• 第5层:错误恢复 - "失败 =主路径"的设计哲学
• 如何设计从需求到代码生成、交付验证的E2E控制链路


下午:模块2 和模块3

模块2:Context工程与权限治理

Part C:Context工程基础

 分层CLAUDE.md的架构(系统级 + 工程级 + 业务级)
 Agentic RAG在长期对话中的应用
 Context压缩与内存预算管理
 工程约束规范化:从 "建议" 变成 "代码"

Part D:权限治理与失败分类

 四大失败模式识别(权限逃逸、工具失败、理解错误、上下文膨胀)
 权限的分层设计:Allow / Deny / Ask / Escalate
 危险工具的高密度约束规范
 失败分类表的标准化(10+ 类型 + 自动恢复规则)
 失败模式 → 对应门禁 → 对应恢复策略
 审计链路:从输入到决策到工具调用

模块3:ATDD验收驱动测试

Part E:ATDD验收体系

 从手工测试到ATDD的转变
 15+ 关键工程用例库设计(Gherkin格式)
 验证分离的必要性:为什么Agent不能自己给自己打分?
 ATDD用例如何覆盖 Query Loop 与恢复分支
 用例覆盖率与质量指标

Part F:实战演练与复盘

 分组设计:选择一个真实场景的、以代码生成/代码修改/PR提交链路为主的Agent系统案例
 小组完整设计输出:3层次Context设计 + 3个SKILLs + 多个门禁
 讲师评审与改进建议
 未来90天行动计划制定
让智能体自主编程不翻车:
从 Context 工程到 Harness 设计的工程实践
维度
哲学
设计环境,让Agent在安全边界内工作
关注点系统工程可靠性
成功标准
长期无故障运行 + 自我修复能力
失败处理
自动分流、智能恢复、可追踪
收益周期3个月内明显(ROI高)







京ICP备2020039808号-4 京公网安备11011202100922号