AI+研发效能10X提升

本论坛将探索人工智能如何赋能研发管理、项目管理和办公自动化等,以显著提高工作效率和质量。深入讨论基于LLM的智能助手、LLM驱动效能度量、智能工具集成、LLM赋能项目管理、LLM赋能CI/CD等关键技术。通过分享成功案例和策略,旨在帮助企业通过AI技术实现效能的飞跃。
出品人:任晶磊
清华大学计算机系博士,前微软亚洲研究院研究员,斯坦福大学、卡内基梅隆大学访问学者;多篇论文发表在 FSE、OSDI 等顶尖国际学术会议上。曾参与微软下一代服务器系统架构设计,获 4 项美国发明专利;《软件研发效能度量规范》标准核心起草专家,参编《软件研发效能权威指南》《软件研发效能提升实践》;研发大数据平台 Apache DevLake 等开源项目发起人。创办思码逸并担任CEO,致力于为企业提供专业的研发数字化、智能化解决方案。
思码逸 创始人兼CEO
小时级 Agent 无干预编程实践与 AI 原生软件开发范式
任晶磊
思码逸 CEO
内容简介:
快速构建原型不是 AI coding 的全部意义。AI 原生软件开发中,比编码速度更重要的能力,是 agent 在完全无人干预的情况下能持续多久产出有价值的工作。我们通过多 agent 协作、基于状态机的可视化 skill 和其它以可靠性(reliability)为首要目标的机制,达到 coding agent 在新旧项目上自主执行若干小时,中途完全无人介入。AI 原生软件开发的背后,是对规约(spec)的合理设计、组织和表达,如何实现 spec 层面的可组合性(composability)和可复用性(reusability)是保证软件质量与可维护性的核心——这些特性对于非“日抛”/“月抛”型软件工程依然重要,并不因 vibe coding 而改变,也将是本演讲重点探讨的话题之一。        

演讲提纲:
1. AI 原生软件开发:持久比快速更重要
2. Agent 自主性实践
2.1 小时级 agent 无干预开发实例若干
2.2 可靠性设计:介于脚本与 skill 之间(AI + 状态机)
2.3 多样性设计:不同模型 agent 配合
2.4 基础设施:基于 container 的 sandbox
3. Spec 基本范式:下一代软件工程人类工作核心
3.1 目标:言简意赅、灵活易用、高扩展性
3.2 Spec 语义:扩展 EARS 为 GEARS
3.3 Spec 组织:可组合性与可复用性
3.4 Spec 层的包与依赖
4. 总结:适合工作场景的看板与工具链

听众收益:
1. 耳听为虚、眼见为实,观览 agent 无人干预工作几小时的实例
2. 了解和应用可靠性为先的 agentic coding 设计机制
3. 了解和应用自主可靠 agentic coding 的实操技巧
4. 了解和实践 spec-driven 开发的本质与核心,跳过冗长学习曲线
5. 学习实现 spec 可组合、可复用的技术与实践        
清华大学计算机系博士,前微软亚洲研究院研究员,斯坦福大学、卡内基梅隆大学访问学者;多篇论文发表在 FSE、OSDI 等顶尖国际学术会议上。曾参与微软下一代服务器系统架构设计,获 4 项美国发明专利;《软件研发效能度量规范》标准核心起草专家,参编《软件研发效能权威指南》《软件研发效能提升实践》;研发大数据平台 Apache DevLake 等开源项目发起人。创办思码逸并担任 CEO,致力于为企业提供专业的研发数字化、AI 原生软件开发解决方案。
从辅助到全自主:
基于SDD范式的“零号员工”开发智能体架构与实践
丁晓彬
中兴通讯股份有限公司 AI教练
内容简介:
随着生成式AI的爆发,AI编程正从代码补全走向端到端的全自主开发 。然而,当前主流单域智能体普遍面临缺乏深层上下文理解、多步任务规划困难以及工具链割裂等痛点 。
本次分享将为您揭秘研发团队打造的全生命周期数字员工——“零号员工”开发智能体 。我们将详细解析如何将SDD(规格驱动开发)方法论内嵌至智能体工作流,构建出高内聚的AI用户故事工厂 。重点探讨打破复杂长程任务瓶颈的四大核心技术:基于代码反构的DesignBase知识底座、实时增量的CodeBase代码语义图、支持上下文分层压缩的三层记忆系统,以及业务对齐的AI自动化评测驱动闭环 。
最后,我们将分享“零号员工”在无人值守场景下24小时持续交付的真实业务实践 。展示其在覆盖众多业务线后,如何实现用户故事AI自主完成率58% ,并助力团队大幅缩短研发周期与降低故障率的关键路径与成效 。

演讲提纲:
1. AI编程新纪元挑战: 从Copilot辅助编码到数字员工全自主开发的演进趋势与核心痛点(上下文缺失、工具孤岛、无记忆) 。
2. “零号员工”架构解密: 零号员工开发智能体的整体架构设计,以及深度融合SDD(规格驱动开发)范式的端到端自动化工作流 。
3. 突破复杂长程任务的核心技术:
3.1上下文工程: 短中长期三层记忆系统与上下文智能压缩机制 。
3.2知识工程: 动态代码语义图(CodeBase)构建与逆向交互式设计知识库(DesignBase)的自动反构 。
4. 无人值守的AI自主研发实践: 基于Jenkins调度的24小时自动获取任务、自主编码、自动化验证与智能提交的闭环链路设计与稳定性保障机制 。
5. 规模化应用与效能跃升: 多维自动评测体系建设、激励运营机制,以及研发效能提升(人均交付数、周期缩短率等)的核心数据展示与未来展望

听众收益:
工作流重构思路: 掌握一套将SDD(规格驱动开发)与大模型深度融合的端到端智能体研发工作流(AI用户故事工厂)的系统建设方法 。
硬核架构与工程方案: 获取解决智能体长程任务“失忆”、“幻觉”及“上下文理解困难”等痛点的落地方案,包括动态代码图谱、自动化文档反构及分层记忆系统
企业级运营与提效路径: 了解数字员工智能体在企业内部的规模化推广策略、双重重试稳定性保障机制及自动化评测体系,为推进“无人值守”式的高效研发提供切实的数据与路径参考

现任中心研究院AI教练,资深研发效能专家。全面负责公司级“零号员工”开发智能体的架构设计与落地建设,以及研究院AI研发效能的整体推进工作。在AI赋能软件工程(AI4SE)领域拥有深厚的实战经验,主导构建了业内领先的基于SDD(规格驱动开发)范式的端到端AI全自主研发工作流 。通过攻克智能体在复杂长程任务中的多层记忆、代码语义图构建及设计知识反构等核心技术瓶颈 ,成功打造了支持“无人值守”和24小时持续交付的AI用户故事工厂 。凭借在研发提效领域的卓越贡献和落地成果,连续多年荣获公司级“最佳实践一等奖”等殊荣 。
去哪儿旅行 L3 AI Coding 的研发平台与 Skills 实践
李佳奇
去哪儿旅行 基础架构负责人 技术总监
内容简介:
2025 年下半年,去哪儿技术团队开启了规模化的 AI Coding 落地,通过 coding 工具研发、研发流水线升级、业务线大规模实践等动作,实现了数百人的业务研发团队长期出码率 75% 以上、L3 级别的 AI Coding 落地成果,并沉淀出研发数字化、AI Coding 工具和自动化流水线等核心基建。本次分享会重点分享从研发数字化到工具和自动驱动出码率和自动化水平提升的实践过程和落地经验,希望能为在研发团队规模化落地 AI Coding 的听众提供有价值的参考。        

演讲提纲:
1. 研发团队落地 AI Coding 的背景
1.1 AI Coding 的等级模型 L1-L3
1.1.1 L1 代码生成辅助
1.1.2 L2 AI + 工程师协作
1.1.3 L3 Skills 驱动的自动化开发
1.2.  去哪儿 AI Coding 目标
1.2.1 指标定义:出码率、自动化水平、研发效率
1.2.2 目标设定:L3 级别的高出码率
1.3.  AI Coding 落地路径
1.3.1 出码率和自动化水平数字化采集
1.3.2 研发平台和 skills 建设
2. AI Coding 数据体系:出码数据和工具会话数据采集和分析
2.1 达成目标的前提:出码率和自动化水平的准确测量
2.2 横跨 CC/Codex/Cursor 等多端的 Coding 工具的会话数据采集方案
2.3 AI Coding 会话数据的 Insight 方案:挖掘最佳实践、识别问题改进
3.去哪儿旅行 AI Coding 典型实践案例
3.1 研发周期从天级缩短到秒级 - AI 研发自动化平台案例:
3.1.1 JDK/Spring 等框架自动升级
3.1.2 业务线一句话需求规模化自动交付
3.1.3 生产环境必修异常自动修复
3.2 人和 AI 协同:业务研发团队典型案例
3.2.1 业务场景复杂需求的 Spec 驱动的落地案例
3.2.2 AI 问题修复和回归测试案例
3.3 核心 Skills 沉淀
3.3.1 一句话需求自动化开发 skills
3.3.2 自动调试和部署 skills
3.3.3 性能自动优化 skills
4. 总结和展望
4.1 当前公司整体 AI Coding 出码率和自动化水平成果
4.2 未来 AI Coding 深入研发流程之后工程师角色和职能的变化

听众收益:
1. 如何定义 AI Coding 度量指标
2. 如何在业务研发团队中规模化落地 AI Coding
3. 如何通过研发平台和 skills 建设提升 AI Coding 水平
4. 完整的 AI Coding 落地实践案例

去哪儿旅行技术总监,基础架构负责人,技术委员会负责人、负责基础架构部门,在公司推广AI智能体、AI 研发、AI 数据获取和分析落地。10余年OTA一线研发经验,在高并发高可用系统建设、DDD项目落地、业务域系统价值度量、线上系统防腐治理等领域有代表性作品。
从传统到智能:
集团产研效能提升三层推进体系(基建-实践-度量)
鞠晓岩
京东科技 资深效能专家
内容简介:
在数字化经济、智能化技术加速迭代的今天,研发效能已经成为企业核心竞争力的关键指标,而需求交付周期长、跨部门协同壁垒高、质量成本失控等痛点,正困扰着众多科技企业的研发体系。本次分享将基于京东在AI赋能研发效能提升领域的实战经验,拆解“标准化-数字化-智能化”的渐进式建设路径,系统阐述“基建-实践-度量”三层人机协同效能体系的构建逻辑。
在过去的一年里,我们聚焦AI技术在研发全流程的落地应用,从统一工具矩阵搭建(AI需求生成、编码复用、智能测试等)到知识资产沉淀,从试点验证到全链路推广,再到数据驱动的持续优化,完整呈现从0到1构建AI研发效能体系的核心方法。同时分享三阶段建设的落地成果与经验总结,为行业提供可复制、可落地的研发效能提升解决方案,助力企业通过AI赋能突破研发瓶颈,支撑业务快速创新。

演讲提纲:
1. AI 赋能的 “物理反应”:工具与体系的整合构建
1.1 核心动作:要素聚合与基础搭建
1.1.1 工具矩阵集成:落地需求端 AI PRD、编码端 JoyCode 复用、测试端 AI 用例生成等专项工具,实现研发各环节工具覆盖
1.1.2 资产中台建设:梳理 PRD/TRD 模板、测试用例库,建立 “提交-审核-更新” 的知识沉淀机制,打破信息孤岛
1.2 关键特征:功能叠加与流程规范
1.2.1 跨环节工具联动:打通需求、开发、测试、发布各阶段工具数据接口,形成初步协同链路
1.2.2 标准化流程落地:通过试点项目验证工具使用规范,明确跨部门评审、灰度发布等基础流程
2. AI 赋能的 “化学反应”:效能与模式的质变突破
2.1 核心表现:智能驱动的价值跃迁
2.1.1 全流程效能升级:AI 自动生成 PRD、测试用例,辅助代码修复与用例自愈,交付周期与缺陷率显著优化
2.1.2 管理模式革新:建立 “效率-质量-成本” 三维度量体系,通过月度报告实现数据驱动的根因分析与改进
2.2 关键支撑:生态与机制的深度融合
2.2.1 人机协同生态成型:工具智能化升级与最佳实践库沉淀结合,形成 “AI 辅助+人工优化” 的研发新模式
2.2.2 长效运营机制落地:通过资源保障、数据留痕、文化引导,确保效能提升成果可持续沉淀
3. AI 提效的 “进化之路”:从 Prompt 交互到基建化落地的实践探索
3.1 演进历程:从零散调用到体系化构建
3.1.1 1.0 阶段:Prompt 原生交互期 —— 依赖人工编写精准 Prompt,实现单点场景(如单条用例生成、简单代码片段优化)的 AI 辅助,无统一标准与流程
3.1.2 2.0 阶段:工具封装期 —— 将高频 Prompt 固化为专项工具功能(如 AI PRD 生成器、用例模板调用),简化操作门槛,实现 “输入需求→输出结果” 的标准化交互
3.1.3 3.0 阶段:基建化落地期 —— 整合工具矩阵与资产中台,打通数据链路,实现 AI 能力与研发流程、知识资产的深度耦合,形成可复用、可扩展的智能研发基础设施
3.2 实践踩坑与解决方案
3.2.1 坑点 1:Prompt 质量不稳定 —— 人工编写的 Prompt 缺乏统一规范,导致 AI 输出结果偏差大、复用性低;解决方案:沉淀行业化 Prompt 模板库,建立 “场景 - 模板 - 参数” 映射关系,通过工具自动注入标准化 Prompt
3.2.2 坑点 2:工具数据孤岛 —— 各专项 AI 工具独立运行,数据不互通(如 PRD 信息无法直接同步至测试用例工具);解决方案:搭建统一数据中台,制定跨工具数据交互标准,实现需求、资产、结果的全链路流转3.2.3 坑点 3:基建适配性不足 —— 初期基建设计未考虑多业务线差异,导致工具与部分场景适配困难;解决方案:采用模块化、可配置的基建架构,支持业务定制化扩展,通过试点验证持续优化适配能力
3.2.4 坑点 4:效果难以量化 —— 缺乏对 AI 提效的明确度量标准,无法精准评估基建投入产出比;解决方案:提前嵌入度量指标(如工具使用率、结果准确率、流程缩短时长),通过数据埋点实现全流程效果追踪
4. 未来展望:从 “赋能” 到 “自主” 的轻量化演进
4.1 技术深化:聚焦 AI 核心能力迭代,推动用例自愈、代码缺陷自动修复等功能优化,实现从 “辅助生成” 到 “主动优化” 的进阶
4.2 价值升维:持续沉淀行业化 AI 训练数据与算法模型,打造更灵活、更适配业务的智能研发支撑体系        

听众收益:
1. 认知升级:明确AI在研发中的核心价值,建立业务驱动的落地理念
2. 方法获取:拆解“基建-实践-度量”体系与三阶段落地路径
3. 工具参考:获取京东AI研发工具选型与整合经验,规避风险
4. 指标能力:学会搭建三维度量体系,用数据驱动研发范式转型
5. 经验复用:借鉴打破AI壁垒约跨部门转型经验,加速效能提升。
核心领域:研发效能度量体系建设、AIGC 研发提效实践
从业背景:京东集团 10年工作经验,深度参与集团研发体系迭代,既精通内部研发流程、技术架构与组织协作模式,也广泛对标行业先进实践,对集团内外研发生态有着全面且深刻的洞察。
核心职责:
效能度量体系建设与推广:搭建科学可落地的度量指标框架,为研发效能优化提供数据支撑;
效能平台与最佳实践推广:通过工具化、平台化手段固化优秀经验,赋能全集团研发团队;
重点业务线效能提升:深入业务场景挖掘效能瓶颈,定制针对性优化方案并推动落地;
AIGC 研发提效探索:探索人工智能技术与研发全流程的融合路径,落地智能化提效应用。
核心理念
以体系化建设为基础、平台化工具为支撑、场景化实践为核心、智能化创新为突破,持续推动研发效率与质量双提升。
华为云AgenticOps探索与实践
付求爱 
华为云AIOps技术负责人
CodeArts代码智能体技术专家
内容简介:
AgenticOps是基于AI Agent+运维自动化技术实现自主响应运维的一种新兴技术,是AIOps的延伸扩展,也是Agent时代运维未来演进方向。本演讲将围绕华为云AgenticOps体系的构建脉络展开,从华为云运维面临的挑战到为什么需要AgenticOps,到如何构建AgenticOps技术,最后会分享当前在华为云内部的落地现状,并对未来进行展望。        

演讲提纲:
1. 华为云AgenticOps体系构建的背景和挑战
1.1 AIOps与AgenticOps的前世今生
1.2 华为云AgenticOps体系构建的背景
1.3 华为云AgenticOps构建面临的挑战
2. 华为云AgenticOps构建思路
2.1 华为云AgenticOps整体构建方案
2.2 关键技术举措
3. 华为云AgenticOps实践效果
3.1 当前实现阶段
3.2 实施效果
4. 总结和展望
4.1 总结
4.2 未来展望        

听众收益:
1. 了解AgenticOps及AIOps的关系及发展脉络
2. 了解华为云AgenticOps构建的核心技术
3. Agent时代,对于运维领域的一些思考和探讨        
在华为公司入职多年,具备丰富的智能化研发领域从业经验,带领团队完成多项智能化运维关键能力构建和技术研究,并进行规模化落地和外溢;发表国家专利二十余篇,在FSE、ICSE、ASE等行业顶级会议上发表多篇论文;在AI编程和AIOps领域具有丰富管理和实践经验。

京ICP备2020039808号-4 京公网安备11011202100922号