AiDD研发数字峰会

「多智能体协同架构」设计与实现

本论坛将聚焦多智能体协同决策与具身智能在前沿人工智能领域的创新实践，深入探讨多智能体系统如何通过大模型赋能，在复杂场景中实现自主协作与智能进化。同时，论坛也将关注具身智能在机器人交互、行为决策以及与人类社会深度融合等方面的最新研究成果。

出品人：王仕亿

英国曼彻斯特大学电子电气工程博士学位，研究方向为集群系统和AI强化学习。旅居欧洲15年，从事多年智能制造、建筑智能、人工智能工程师和科研工作。目前为上海交通大学和普元信息联合博士后工作站在站博士后，从事AI架构研究。主要从事AI算法、架构、智能体设计，参加多项国家AI标准制定以及国家AI相关课题研究。同时兼任普元信息Al科学家工作，负责公司AI架构和智能体设计。其他社会职务，包括:IEEEAI系列标准编委会专家、国家信通院A系列标准编委会专家、百度文心开源服务站专家。

普元信息AI科学家

自主进化智能体：从固定工作流到动态架构的演进

张驰

西湖大学博导 AGI实验室负责人

内容简介：

本次演讲将深入剖析多个前沿应用场景，系统性地展现自主进化智能体从刚性工作流向动态自适应架构的范式跨越。通过对 GUI 智能体、医疗智能体以及数据库智能体等典型应用案例的介绍与分析，我们将共同见证智能体在工作范式、记忆广度与上下文理解深度上的全方位进化。这些案例不仅清晰地勾勒出智能体从单纯的效率工具向具备自我迭代能力的智能实体转变的演进脉络，更深刻探讨了这种演化在应对现实世界复杂不确定性时的关键意义，旨在为构建具备生命感的自主智能系统提供全新的理论视野与实践参考。

演讲提纲：
1. 自主进化智能体的背景与核心挑战
痛点：传统 Agent 依赖预定义（Hard-coded）的刚性工作流，面对复杂、模糊且多变的环境时极易失效。
契机：大模型能力的涌现为 Agent 提供了从“指令执行”向“策略自演进”跨越的可能。
2. GUI 智能体：从表层交互到深度逻辑进化
感知进化：实现对 App 业务逻辑的深度理解，而非仅停留在 UI 控件的像素级识别。
效能进化：通过对执行空间的动态探索与策略修剪，实现操作路径的最优化与执行效率的指数级提升。
3. 数据库 Agent：针对底层特性的特化演进
领域适配：针对数据库的 Schema 结构、索引特性及查询优化器进行深度的针对性进化。
闭环优化：基于执行反馈不断自我修正调度策略，实现从通用对话到专业数据库专家的角色转变。
4. 架构演进：从零构建高效智能体实体
自发生长：探索 Agent 架构如何从基础组件出发，通过环境交互自动迭代出最适合任务的协同拓扑。
动态重构：打破固定的模块堆砌，实现记忆机制、上下文调度与推理逻辑在任务过程中的实时自我重组。
5. 结语：迈向具备生命感的自主智能系统
总结：从固定工作流向动态架构的演进，是智能体具备应对现实世界不确定性的关键。
展望：探讨这种自我迭代能力对于构建真正意义上的“数字生命”的深远意义。

听众收益：
1. 了解最新Agent研究思想
2. Agent进化的应用案例

现任西湖大学特聘研究员，博士生导师，并担任通用人工智能（AGI）实验室负责人。在加入西湖大学前，曾入选腾讯“技术大咖”头部人才计划担任高级研究员。他长期深耕生成式AI与多模态大模型研究，在CVPR、TPAMI等国际顶尖会议及期刊发表论文60余篇，并连续入选斯坦福大学“全球前2%顶尖科学家”榜单。张驰博士致力于产学研的深度融合，其主导研发的生成式模型曾支撑腾讯QQ核心业务，服务上亿用户。同时，他积极构建开源生态，主导的AppAgent、MeshAnything、Metric 3D等知名开源项目在GitHub累计获星超20,000，被工业界与学术界广泛采纳为行业基准。

模仿生物集群智能的大模型注意力提升实践与场景落地应用

王仕亿
普元信息 AI科学家

内容简介：

从自然界中的集群现象出发，通过仿真与物理实验复现集群聚集行为逻辑，将集群智能应用于解决大模型注意力问题，重点落地数据湖智能找数、文本热点信息标注、知识库构建，验证了集群智能体在提升检索匹配效率、标注准确度的实际价值，展现其在多行业的应用潜力。

演讲提纲：
1. 演讲者及研究背景介绍
1.1 个人履历、研究方向与从业经验
1.2 参与的科研项目、标准制定及论文成果
2. 自然集群智能现象的研究与实践基础
2.1 自然中的群体智慧：蜜蜂、鸟群、鱼群等集群行为
2.2 在奥地利集群智能实验室的研究经验：蜂群趋热聚集的仿真和研究
3. 集群聚集行为的技术实现
3.1 仿真层面实现人工群体聚集行为：双源环境热区聚集对比、三源动态环境追踪、病毒传播聚集行为模拟
3.2 物理层面实现：集群机器人 Mona 光源聚集实验
4. 集群智能的现实应用方向
4.1 跨领域应用场景：城市公共交通、医疗卫生细胞运动、互联网流量监控
4.2 核心应用方向：解决大模型智能体的注意力问题
5. 根据集群去热实验仿真提升大模型注意力的具体场景落地
5.1 政务数据湖智能找数场景
5.1.1 找数业务核心痛点：语义化需求难匹配、搜索不灵活、人工理解门槛高、数据定位精准度低
5.1.2 解决方案：基于资产 / 职责目录、需求清单构建找数智能体，实现需求到标签的拆解
5.1.3 POC 验证成果：核心指标表现、匹配效果与检索可解释性分析
5.2 知识库构建：基于信息热点挖掘关键词及热度，搭建专属知识库
5.3 另一个AI 场景
5.3.1 案件处理流程：案件信息识别→大模型生成标签→标签与调解案件关联→数据统计输出
5.3.2 人工与 AI 判断结果对比：各案件类型误判率分析
5.3.3 效率对比：大模型在样例 / 全量案件分类标注中的效率提升数据
6. 总结与致谢

听众收益：
1. 展示产学研的链路，从科学实验到AI场景落地，从自然集群现象提炼 AI 技术逻辑的思路，了解自然集群智慧聚集原理向集群智能体注意力提升的转化方法，为 AI 技术创新提供自然仿生视角。
2. 能清晰知晓政务数据找数、司法案件分类等实际业务的 AI 落地路径，掌握智能体在解决语义匹配、效率低下等行业痛点的实操方案。
3. 可获取集群智能在多领域的应用案例与效果数据，直观了解该技术在政务、金融、司法等场景的落地价值与实践潜力，为自身业务的 AI 升级提供参考。

普元信息AI科学家，负责AI（智能体）架构团队，承接上海大数据中心公共数据治理，工商联智能体等项目负责人。擅长集群系统强化学习，AI智能体架构设计。英国曼彻斯特大学博士，上海交通大学AI博士后，研究方向为集群系统与AI强化学习。深耕欧洲工业和科研领域15年，参与西门子数字化工厂建设项目，若干欧盟科研项目。在集群系统、强化学习、数据治理方面的重要期刊和顶级会议中有多篇论文。同时参与多项国际IEEE、国家AI、可信数据集、数据空间等相关标准制定工作。

Agentic Skill 在阿里云 ECS 大规模诊断中的实践与落地

胡兵

阿里云技术专家

内容简介：

从ECS运维的真实故障场景出发，讲述如何将专家的诊断经验封装为Agent可自主执行的"Skill"，构建以Agentic Skill为核心的CloudBot智能体。重点介绍Skill的定义与设计理念、四层系统架构、知识蒸馏与固化流程、自主诊断执行机制、安全可信保障，以及真实故障场景的诊断实录，展示Agentic Skill在大规模生产环境中的工程实践与落地效果。

演讲提纲：
1. 问题与挑战：ECS运维到底难在哪
1.1 一次常规发布引发的连环宕机——真实故障案例
1.2 ECS三层架构（Guest/Host/CIPU）的复杂性
1.3 专家瓶颈：4小时+排查、320+工时/月、经验用完即丢
1.4 RAG和规则引擎为什么不够——从"告知"到"执行"的鸿沟
2. Agentic Skill是什么：核心概念定义
2.1 Skill = SOP的可执行版本（触发条件 + 诊断逻辑 + 工具白名单 + 执行约束）
2.2 一个真实Skill长什么样：NC宕机诊断Skill示例
2.3 渐进式暴露：YAML元信息 + Markdown诊断逻辑
2.4 三种模式对比：规则引擎 vs 纯Agent vs Agentic Skill
3. CloudBot四层架构：请求怎么进来，Skill怎么跑起来
3.1 四层架构总览：Service → API → Core → Infrastructure
3.2 核心引擎：Master Agent / SubAgent / Code Agent 三类Agent协同
3.3 200+ MCP工具集与48个Skill的组织管理
4. 知识蒸馏与Skill固化：48个Skill从哪来
4.1 ECS运维知识体系：6大类知识库梳理
4.2 知识蒸馏四步法：LLM生成 → 专家review → 历史案例回放 → 灰度上线
4.3 五大场景覆盖：故障诊断 / 信息查询 / 运维操作 / 批量分析 / 流程编排
4.4 知识飞轮：命中率、采纳率、失败率驱动的持续优化
4.5 真实迭代案例：VM启动失败Skill的三次优化（V1→V2→V3）
5. 一次诊断怎么跑完：五步流程与三个Middleware
5.1 五步自主诊断流程：触发匹配 → TODO规划 → 工具调用 → 动态调整 → 报告生成
5.2 TodoList Middleware：让诊断过程可见可追溯
5.3 SubAgent Middleware：子任务隔离执行，防止上下文腐化
5.4 Filesystem Context：Token占用降95%，诊断成功率60%→99%
5.5 渐进式Skill暴露：按阶段动态加载工具，幻觉率降50%
6. 安全与可信：生产环境跑Agent怎么保证
6.1 第一道防线：Sandbox三层隔离（容器隔离 + 进程隔离 + 资源隔离）
6.2 第二道防线：可信推理——上下文管理、工具接地（Tool Grounding）、幻觉抑制
6.3 第三道防线：四层诊断报告可验证（One Page结论 / 详细总结 / 故障事件线 / 证据清单）
6.4 SSE实时推送：诊断过程全透明可审计
7. 真实故障诊断实录
7.1 案例一：NC宕机诊断——从20分钟到3分钟（效率提升6倍）
7.2 案例二：VM启动失败——从15分钟到2分钟（效率提升7倍）
7.3 深入案例：一次ECS启动失败的完整64秒诊断过程还原
7.4 诚实复盘：Agent翻车的两个案例与经验教训
8. 演进展望：从诊断Copilot到自主运维Agent
8.1 CloudBot平台与智能体的关系
8.2 方向一：Skill半自动蒸馏——从"写Skill"到"审Skill"
8.3 方向二：告警驱动的自动诊断闭环——从被动响应到主动值班
8.4 方向三：MCP工具化与多Agent协作
8.5 演进路线图：L1诊断Copilot → L2深度诊断 → L3自主运维 → L4自进化系统
9. 总结与关键数据
9.1 核心成果
9.2 一个简单的乘法：自主运维能力 = Skill覆盖率 × 诊断准确率 × 修复成功率 × 安全置信度
9.3 愿景：从"凌晨三点被电话叫醒"到"早上九点看Agent的值班报告"

听众收益：
架构认知：掌握 LLM Agent 在基础设施运维领域的落地架构设计。
实战经验：了解如何构建高可用、低幻觉的“诊断技能库”（Skill Set），解决复杂场景（如系统宕机、网络抖动）的归因难题。
工程避坑：获取在大规模场景下控制 Agent 成本、保障执行安全（Safety）及提升响应速度的工程化方案。
未来视野：洞察从自动化（Automation）向自主化（Autonomy）演进的SRE新趋势。

阿里云弹性计算团队技术专家，专注阿里云大规模ECS运维系统的智能化建设。负责CloudBot智能体平台架构设计与落地，主导将Agentic Skill技术应用于ECS故障诊断、运维自动化等核心场景。在AI Agent、大模型运维应用、知识蒸馏与工具编排等方向有深入实践经验。

从辅助到全自主：
基于SDD范式的“零号员工”开发智能体架构与实践

丁晓彬

中兴通讯 AI教练

内容简介：

随着生成式AI的爆发，AI编程正从代码补全走向端到端的全自主开发。然而，当前主流单域智能体普遍面临缺乏深层上下文理解、多步任务规划困难以及工具链割裂等痛点。
本次分享将为您揭秘研发团队打造的全生命周期数字员工——“零号员工”开发智能体。我们将详细解析如何将SDD（规格驱动开发）方法论内嵌至智能体工作流，构建出高内聚的AI用户故事工厂。重点探讨打破复杂长程任务瓶颈的四大核心技术：基于代码反构的DesignBase知识底座、实时增量的CodeBase代码语义图、支持上下文分层压缩的三层记忆系统，以及业务对齐的AI自动化评测驱动闭环。
最后，我们将分享“零号员工”在无人值守场景下24小时持续交付的真实业务实践。展示其在覆盖众多业务线后，如何实现用户故事AI自主完成率58% ，并助力团队大幅缩短研发周期与降低故障率的关键路径与成效。

演讲提纲：
1. AI编程新纪元挑战：从Copilot辅助编码到数字员工全自主开发的演进趋势与核心痛点（上下文缺失、工具孤岛、无记忆）。
2. “零号员工”架构解密：零号员工开发智能体的整体架构设计，以及深度融合SDD（规格驱动开发）范式的端到端自动化工作流。
3. 突破复杂长程任务的核心技术：
3.1上下文工程：短中长期三层记忆系统与上下文智能压缩机制。
3.2知识工程：动态代码语义图（CodeBase）构建与逆向交互式设计知识库（DesignBase）的自动反构。
4. 无人值守的AI自主研发实践：基于Jenkins调度的24小时自动获取任务、自主编码、自动化验证与智能提交的闭环链路设计与稳定性保障机制。
5. 规模化应用与效能跃升：多维自动评测体系建设、激励运营机制，以及研发效能提升（人均交付数、周期缩短率等）的核心数据展示与未来展望

听众收益：
工作流重构思路：掌握一套将SDD（规格驱动开发）与大模型深度融合的端到端智能体研发工作流（AI用户故事工厂）的系统建设方法。
硬核架构与工程方案：获取解决智能体长程任务“失忆”、“幻觉”及“上下文理解困难”等痛点的落地方案，包括动态代码图谱、自动化文档反构及分层记忆系统
企业级运营与提效路径：了解数字员工智能体在企业内部的规模化推广策略、双重重试稳定性保障机制及自动化评测体系，为推进“无人值守”式的高效研发提供切实的数据与路径参考

现任中心研究院AI教练，资深研发效能专家。全面负责公司级“零号员工”开发智能体的架构设计与落地建设，以及研究院AI研发效能的整体推进工作。在AI赋能软件工程（AI4SE）领域拥有深厚的实战经验，主导构建了业内领先的基于SDD（规格驱动开发）范式的端到端AI全自主研发工作流。通过攻克智能体在复杂长程任务中的多层记忆、代码语义图构建及设计知识反构等核心技术瓶颈，成功打造了支持“无人值守”和24小时持续交付的AI用户故事工厂。凭借在研发提效领域的卓越贡献和落地成果，连续多年荣获公司级“最佳实践一等奖”等殊荣。

AiDD峰会

K+峰会

联系我们