AiDD研发数字峰会-上海站

出品人：南志文

邮政集团邮乐网技术VP

超过13年互联网平台产品、技术架构和研发管理工作经验，曾就职于阿里巴巴集团、携程集团、巨人网络集团等大型知名公司，先后担任过 CTO、技术副总裁、研发总监、首席架构师等职务，先后主导负责多个亿量级产品的前后端的整体架构设计与研发工作，拥有丰富的大型电商交易平台技术架构经验以及超过600人大型研发团队管理经验。
在大数据、AI 大模型、低代码、业务和产品结合模式创新、研发效能工具创新、企业中台化架构和数字化创新转型等领域拥有丰富的实践经验，现全面负责整个公司的技术研发管理、整体前沿技术战略、技术架构和规划实施落地，持续致力于通过大数据和AI等先进技术驱动业务模式发展创新。

Al生产力工具创新

本论坛聚焦于最前沿的AI技术，包括机器学习框架、模型部署工具、自动化工程平台等关键技术，深入探讨如何构建高效的、覆盖研发生命周期的AI工具链，以加速开发周期和提高模型性能，同时探讨工程平台在大规模部署和管理AI应用中的挑战和解决方案，并关注在AI工程领域中的最佳实践和案例分享，探讨如何构建可靠、可扩展的AI工程平台，以支持企业的数字化转型和创新发展。

基于MobileFlow的终端自动化测试效能跃升实践

唐晓璇

蚂蚁集团 CIO高级算法工程师

内容简介：

在AI驱动研发效能革命的浪潮中，MobileFlow创新性提出基于多模态智能体终端测试架构，攻克传统自动化测试的两大顽疾——动态场景适应不足以及对复杂UI交互的高额维护成本。通过自研多模态大模型与因果可解释断言机制的结合，系统实现了界面操作意图的精准映射和问题根因的智能定位。基于沉淀的万级手机UI数据集和LLM-Native的Totoro自然语言指令体系，为智能时代生产力工具提供了新思路。

演讲提纲：
1.传统UI自动化测试的行业通用痛点
1.1 传统测试背景
1.2 目前行业痛点
2. 自动化测试agent现状
3．平台介绍
3.1算法API体验
3.2 设备托管功能
4．技术发展路线及技术创新
4.1数据驱动
4.2 UI Agent构建
4.3 动线智能纠偏
4.4 记忆与探索增强
5.平台在工业级场景落地应用

听众收益：
1.洞悉大模型驱动的智能测试技术发展路径
2.掌握AI测试增效的底层范式
3. 解锁智能研发效能提升体系

就职于蚂蚁集团，专注于研发效能优化方向，主要工作方向为AI驱动的研发效能体系创新。作为MobileFlow技术团队的算法工程师，聚焦多模态大模型与智能体技术的前沿探索，主要研究方向包括：1）视觉-语言联合建模在UI自动化测试中的精准指令理解与执行；2）LLM-based Agent的复杂任务分解与动态规划能力优化；3）跨平台界面操作智能体的端到端自动化测试框架构建。为复杂场景下的研发效率与质量提升提供技术驱动力。

基于LangGraph框架和Ambient智能体构建企业级智能研发平台

张海立

LangChain Ambassador

内容简介：

这种模式特别适合需要 AI 辅助但仍需人工判断的复杂业务场景，如客户服务自动化、内容审核、知识管理等领域。通过本次演讲，听众将了解如何基于 LangGraph 框架及 LangGraph Cloud 平台实现 Ambient Agent，并通过实际案例展示其在企业环境中的应用效果和价值。

演讲提纲：
1. Ambient 智能体的核心理念与 LangGraph 框架介绍
1.1Ambient 智能体的定义：事件驱动、多任务并行、减少用户交互负担的智能代理
1.2与传统 AI 应用模式的本质区别：从被动响应到主动感知
1.3LangGraph 框架的核心功能：持久化层、人机协作支持、长期记忆、定时任务
2. 企业级人机环路（Human-in-the-Loop）工作流程设计
1.1Ambient 智能体的三种主要人机协作模式：通知（Notify）、提问（Question）、审查（Review）
1.2Agent Inbox 用户体验设计：跟踪未完成操作的新型交互界面
1.3企业级应用场景分析：邮件助手、研发需求导入助手
1.4工作流程实现步骤与关键代码演示
3. 构建企业级智能平台的最佳实践与未来展望
3.1平衡自动化与人工干预的策略：何时、如何引入人类参与
3.2企业级部署的安全性、可扩展性与性能优化考量
3.3未来发展趋势：Ambient 智能体如何重塑企业工作流程与人机协作模式

听众收益：
1.实用技能获取：听众将掌握设计和实现 Ambient Agent 的具体方法和技术路径，能够将所学直接应用于企业项目中。
2.效率提升策略：了解如何通过人机环路机制优化企业工作流程，在保证质量的同时显著提高运营和研发效率。
3. 技术前沿洞察：获得 AI 应用最新范式的深度理解，把握 LLM 技术在企业级应用中的发展趋势和最佳实践。

《LangChain实战》系列作者，LangChain Ambassador，LFAPAC 开源布道师。B 站 UP 主，万粉、百万播放成就。专注于 AI Agent 的研发和评估评测体系的研究和实践。

推动研发智能再升级：通义灵码在 AI Coding领域新突破

张燎原

阿里云通义灵码产品负责人

内容简介：

随着人工智能技术的快速发展，AI Coding已成为提升软件开发效率的重要方向。通义灵码作为国内用户规模第一的智能编程助手，在实际应用中不仅要解决代码生成的速度和准确性问题，更要应对企业级开发中的挑战。本次分享将深入分享通义灵码产品演进、AI程序员发展及落地进展、Agent能力等，以及在企业级研发场景下的技术创新和实践经验。同时，结合实际落地案例，展示如何将AI技术真正赋能企业研发效能提升，为企业级智能编程助手的发展提供有价值的参考。

演讲提纲：
1.AI Coding领域最新进展、挑战与机会
2.通义灵码技术创新与突破、关键的技术实现
3.通义灵码在企业落地的技术挑战与技术方案
4.行业标杆案例解析
5.通义灵码的未来规划

听众收益：
1.深入了解通义灵码智能编程助手的技术架构和核心能力
2.获得大模型在企业研发场景的实践经验和方法论
3.掌握智能编程助手落地过程中的关键考量点和解决方案

经历过消费电子、通信及互联网多个行业，长期从事软件研发管理、效能改进及产品创新，负责组织级效能改进实施和转型，及数字化研发管理体系的建设。目前致力于打造数字化产品研发体系，服务于中国软件研发行业，推动企业数字化转型。译有《程序员度量》、《软件驱魔》等，是《研发效能36计》、《阿里巴巴研发效能三板斧》课程主讲人。BizDevOps共促计划专家。

AI 生产力工具产品的构建提效实践

张涛

商汤科技小浣熊家族技术负责人

内容简介：

AI原生应用正经历从技术突破到产业落地的系统性变革，我们作为AI应用的早期开发者，在这场变革即将来临之际，从我们一路走来的过往实践之中，形成了不少深度的思考，与大家一起分享与探讨。
技术突破层面，大模型能力通过多模态融合与持续预训练实现质变跃迁，推理成本因稀疏激活、模型蒸馏等技术突破而下降两个数量级，结合场景化数据的定向调优，AI开始穿透复杂业务逻辑。
架构演进维度，系统设计从单一模型中心转向分布式智能体网络，开发范式重构为""提示工程-反馈强化""双循环模式，硬件层面存算一体架构与算法轻量化形成深度协同。
落地实践路径，模型在垂直领域持续构建""主场优势""，工程架构通过动态负载均衡、增量学习等机制突破规模化瓶颈，跨系统互联催生人机共生新生态。

演讲提纲：
1.初代架构：AI作为能力提供者
1.1 嵌入AI解决过往系统中的盲点
1.2.模型性能与模型能力的限制
1.3.有限的能力扩展上的努力
2.架构趋势：AI原生系统的演进方向
2.1 从「模型中心」到「智能体网络」
2.2 开发范式重构
2.3 硬件-算法协同进化
3.落地实践：技术到场景的穿透路径
3.1 模型主场能力持续精进
3.2 工程架构探索与优化
3.3 系统互联拓展无限可能
4.风险与挑战：技术演进暗礁
4.1.模型可靠性悬崖
4.2.可信技术滞后

听众收益：
1.掌握下一代AI应用开发范式
听众将系统理解""提示工程-反馈强化""双循环模式（参考阿里新夸克AI超级框架构），以及如何通过分布式智能体网络实现复杂业务穿透（如京东超万个AI智能体协同创造百亿GMV）。结合台达800V HVDC供电架构等硬件创新，可构建存算一体的高能效系统。
2.获取降本增效的实战方法论
通过稀疏激活、模型蒸馏等技术（如字节MoE架构训练成本降40%），听众可掌握将推理成本压缩两个数量级的实施路径。学习动态负载均衡机制（参考阿里3800亿投入的云基建设）和增量学习策略，突破金融、工业等领域的规模化瓶颈（如Manus智能体提升券商决策效率65%）。
3.把握人机共生生态构建先机
深度解析垂直领域主场优势构建逻辑（如瑞智病理模型覆盖90%癌种），结合跨系统互联实践（如优必选机器人工厂协同），帮助听众提前布局教育、医疗等场景的人机协作新范式。参考Meta、Rokid新一代AI眼镜的多模态交互突破，设计符合未来趋势的智能终端解决方案。

商汤科技小浣熊家族技术负责人，主导了小浣熊家族的应用落地全进程，对AI应用落地有深刻的理解和丰富的实践经验。以代码模型为产品AI能力基底，小浣熊家族一方面为原生的开发者场景提供了AI编程助手产品，代码小浣熊；另一方面，也破圈地将代码能力作为AI工具，拓展产品能力边界，为办公人群提供了AI生产力应用，办公小浣熊。这也使得小浣熊家族成为了国内极具特色的AI生产力系列产品。

蚂蚁数科AI Agent质量保障体系建设探索

张鑫

蚂蚁集团数字科技线高级测试开发

内容简介：

基于RAG&ToolUsing等关键技术构建的AI Agent体系凭借其显著减少幻觉、实现知识动态更新、保障隐私安全等核心优势，已成为AI Agent系统关键的技术基础设施。
本议题将重点探讨以AI Agent为核心的质量保障体系构建，从性能、效果等关键维度建立系统的评测方法论，提出覆盖Agent全生命周期的质量保障体系，该体系能够提供可复用的质量保障方法，最终实现智能体应用在企业复杂场景中的有效落地

演讲提纲：
1. AI Agent在蚂蚁数科的应用场景。
2. Agent质量保障的整体方法论策略。
3.Agent有标效果评测与无标效果评测的科学方法与标准化体系。
4. Agent性能测试的技术方法和评估标准。
5. Agent一站式质量平台建设与实践。

听众收益：
1. 评估与选择能力提升：学习AI Agent的评测方法和标准，有助于听众在实际工作中更好地评估不同解决方案的优劣，为项目选型或技术架构决策提供科学依据。
2. 技能与工具掌握：评测过程中涉及的评测数据处理、效果评估、性能压测等核心技能，为听众提供宝贵的实践机会，显著提升听众在AI领域的专业能力，同时深入理解相关工具和平台的建设思路。

专注于AI Agent评测、算法评测等质量平台建设平台建设，具备丰富的测试工具开发，质量效能平台实施和落地经验，目前在蚂蚁数科质量团队担任核心开发，主导AI评测平台的技术攻坚与创新方案探索。

AiDD峰会

K+峰会

联系我们