朱少民
《软件工程 3.0》作者/CCF 杰出会员/AiDD 技术委员会成员
课程时间:1天(6小时)
课程形式:理论 + 案例分析 + 小组实战
课程目标(收益):
学员将带走一套“自主编程智能体 Harness 质量管控体系”,把 AI 从“能写代码”升级到“能交付可靠代码”,核心收益包括:
1. 理解范式演进与核心公式:掌握为什么需要 Harness、以及 Agent = Model + Harness 的工程含义。
2. 定位并修复失败根因:吃透自主编程常见的内生失败(例如“虚报完成/跳过测试/越权操作/上下文失控”),知道它们分别属于哪一层治理。
3. 搭建四层质量防线:用“规则约束→能力封装→事件门禁→硬校验/沙箱”的纵深体系,让质量与安全具备“可执行的确定性”。
4. 形成项目级记忆与上下文基座:掌握 CLAUDE.md 的工程写法与信息密度策略,降低遗忘与上下文浪费。
5. 实现可观测与可审计:建立可追踪、可诊断的端到端观测框架(思维链日志/指标/Trace),让问题可复盘、成本可归因。
6. 输出可复用落地件:带走配置清单与最小可行管控方案(适配个人/团队/CI)。
课程特点
• “少而精”:围绕自主编程智能体质量管控的关键决策点组织内容,避免泛泛讲 Agent。
• 理论—工程—验证闭环:每个理论模块都对应一个“可落地的门禁/模板/检查点”。
• 以失败为锚点:不讲“最佳实践清单”,而讲“失败如何发生—如何被工程化阻断”。
• 强调纵深防御与可观测性:安全、质量、成本都通过同一套治理与观测机制统一管理。
• 面向落地交付:课堂产出直接用于构建或改造学员的自主编程工作流(本地或 CI/CD)。
课程内容大纲
模块1:Harness Engineering 的“质量内核”
• 三次范式演进:提示词 → 上下文 → 驾驭工程
• 核心公式拆解:Agent = Model + Harness
• Harness 的横切目标:可靠性(验证闭环)/安全性(边界治理)/成本效率(Token经济学)/可协作(标准化集成)
• 互动:学员快速对齐自己遇到的“失败现象”,映射到治理层级
本模块产出:一个“质量问题→治理层级”的认知框架
模块2:自主编程智能体的三大失败模式
围绕真实痛点讲清楚“为什么会错”,并给出“如何工程化阻断”:
1. 虚报完成偏差:为什么 Agent 总爱提前宣布“做完”,如何用验证门禁阻止
2. 上下文焦虑:上下文逼近窗口时如何导致质量坍塌,如何设计压缩/分页/分解
3. 一次过度涉猎:为什么一步做全导致不完整交付,如何用计划/分工/逐步完成定义 DoD
本模块产出:三类失败 → 对应的四层防线选择原则(“先堵哪道门”)
模块3:项目级记忆与上下文基座
• 为什么需要记忆:降低遗忘、提升一致性、减少重复解释成本
• CLAUDE.md 的契约式工程结构:约束、红线、关键决策、测试门禁要写成“可执行口径”
• 信息密度策略:什么必须进上下文、什么靠工具按需检索
• 演示:从“文档堆砌版”到“可管控版”的差异与评估标准
本模块产出:学员带走一套类似CLAUDE.md写作结构与检查清单
模块4:四层防线质量治理(核心方法,真正落地)
用统一的治理语言把系统搭起来:
• 防线A:规则约束(command 级)
阻断危险命令/敏感文件访问/不允许的输出声明
• 防线B:能力封装(Skills)(把 SOP 变成可调用能力)
典型:safe_commit_workflow(单测→Lint→提交门控)
• 防线C:事件门禁(Hooks)(关键节点强校验)
典型:PostToolUse 做格式/Lint/测试门控;高风险 PreToolUse 做风险评估
• 防线D:硬校验/沙箱(Verification & Isolation)
在隔离环境中执行高风险动作,失败可回滚、结果可证据化
本模块产出:一份“自主编程最小可行质量管控方案(MVP)”设计草图
模块5:可观测性驱动的质量控制(让治理可诊断)
• 三大支柱:思维链日志、多维指标、端到端Trace
• 质量与成本如何被“看见”:
o 成功率、重试次数、工具调用分布、上下文利用率、失败时的关键 Span
• 课堂演示:如何从Trace快速定位“为什么没测就说完成/为什么越权”
本模块产出:学员明确“需要观测哪些指标才能持续改进”
模块6:落地路径与评估(让课程能带回去做事)
• 个人→团队→组织:Harness成熟度演进(L1~L5)与里程碑
• 3 个月行动清单(最少投入的关键顺序)
• Q&A:把学员项目映射到“先做哪件事、如何验证有效”
本模块产出:学员个人/团队的落地路线图(1 页)
同济大学特聘教授、CCF杰出会员、软件绿色联盟标准评测组组长,近三十年来一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖,已出版了二十多部著作和4本译作,代表作主要有《软件工程3.0》、《软件测试方法和技术》、《全程软件测试》、《敏捷测试》等,并经常在国内外学术会议或技术大会上发表演讲,曾任思科(中国)软件有限公司QA高级总监、IEEE ICST2019工业论坛主席、IEEE ICST、QRS、DAS等国际学术会议的程序委员、《软件学报》审稿人等。
自主编程智能体质量管控体系
从失败模式到工程防线:让 AI 代码“可控、可验证、可治理”