智能缺陷检测与定位

智能缺陷检测与定位是保障软件质量、提升研发效率与系统安全性可靠性的核心支撑技术。当前,大语言模型技术持续迭代,重塑了代码审查、软件测试、漏洞溯源、缺陷归因的传统模式,更在工业场景和复杂系统中实现深度落地。本论坛聚焦大模型技术飞速发展的背景下,智能缺陷检测与定位的前沿技术突破、实际应用痛点、以及产业落地路径,深入探讨技术迭代中的新机遇、新挑战与新范式,搭建学界与业界的交流桥梁,推动技术创新与产业实践深度融合。     
出品人:谢晓园
武汉大学教授、博导,武汉大学珞珈青年学者,武汉大学特色化示范性软件学院副院长,外国优秀青年学者研究基金获得者。主要研究方向为蜕变测试、软件缺陷定位、智能软件工程等。主持了多项国家自然科学基金,参与多项国家自科基金重点项目、国家重点研发项目等,参与两项软件测试国家标准的制订。在软件工程顶级或知名期刊会议上录用论文50余篇。曾获NASAC青年软件创新奖、ACM SigEvo HUMIES银奖、ACM SigSoft Distinguished Paper Award等学术奖励。  
武汉大学计算机学院 教授
AI时代GUI Agent赋能软件缺陷检测
张雅坤
哈尔滨工业大学(深圳) 副教授
内容简介:
在 AI 时代,GUI Agent 正逐渐成为提升软件缺陷检测能力的重要技术路径。传统软件缺陷检测方法在面对复杂图形界面、多步骤交互和动态上下文时,往往存在自动化程度低、场景覆盖不足以及语义理解能力弱等问题。报告人围绕“GUI Agent 赋能软件缺陷检测”开展了一系列研究,探索如何结合大语言模型、界面感知与智能体决策能力,提升缺陷检测的自动化、准确性与实用性。
报告将介绍该方向的最新研究进展,展示 GUI Agent 如何从“能操作界面”进一步发展为“能理解任务、能发现问题、能辅助分析”的智能缺陷检测主体,为 AI 时代软件质量保障提供新的思路与方法支撑。

演讲提纲:
1. GUI Agent在软件工程领域与软件缺陷检测的使用
2. 本课题组在GUI Agent赋能软件缺陷检测的代表工作
3. GUI Agent潜在研究点

听众收益:
1. 了解GUI Agent的现状
2. 启发希望做GUI Agent 赋能软件工程相关的科研的听众        

哈尔滨工业大学(深圳)计算机学院副教授,博士毕业于北京大学,师从张路教授和郝丹教授,曾赴新加坡国立大学访问;入选腾讯“青云计划”、字节跳动“筋斗云计划”、快手“快STAR计划”、中国科协青年人才托举工程(博士生专项)、北京市优秀毕业生、CCF系统软件专委优博提名奖、北京大学校长奖、中科院院长奖。长期从事智能化软件工程和大语言模型相关研究,主要关注移动应用测试、智能需求工程、多智能体协作等。研究成果发表于 ICSE、ISSTA、TOSEM 等CCF-A类软件工程国际会议/期刊,担任CCF-A类软件工程会议ICSE、ASE的程序委员会成员及期刊TSE、TOSEM 的审稿人。研究成果在微软、华为等公司应用。
双维度软件缺陷智能化检测:从功能漏洞到性能瓶颈
任晓雪
浙江大学软件学院“百人计划”研究员
内容简介:
内容软件缺陷是影响系统可靠性与用户体验的核心挑战。传统缺陷研究多聚焦于功能正确性,而忽视了性能层面的隐性缺陷。本报告围绕功能性缺陷与性能缺陷两个维度,系统介绍基于大语言模型(LLM)与智能Agent的缺陷定位与检测前沿进展。        

演讲提纲:
1. 研究背景与动机:软件缺陷的双维度挑战,阐述功能性缺陷与性能缺陷的现状、危害与传统方法局限性
2. 功能性缺陷定位与检测:基于LLM的代码故障定位Issue级精准定位技术
4. 性能缺陷度量与检测:代码效率基准构建与项目级性能瓶颈智能识别,填补性能缺陷系统化评估的空白
5. 总结与展望:双维度缺陷检测的统一视角,以及Agent驱动的下一代智能缺陷检测技术趋势

听众收益:
1. 掌握LLM赋能缺陷定位的最新方法:了解大语言模型如何突破传统故障定位的语义理解瓶颈,从代码故障到Issue级别的精准定位技术路径与实践经验
2. 建立性能缺陷的系统化认知:突破""缺陷=功能错误""的传统认知局限,学习如何对代码效率进行科学度量与基准评估,填补性能缺陷研究视野的空白        

现担任浙江大学软件学院“百人计划”研究员,研究方向聚焦于智能化软件工程、软件质量保证、vibe coding。近年来在 ICSE、FSE、TSE、ASE、ICLR 等软件工程及人工智能顶会顶刊上发表 CCF-A 类论文二十余篇,申请发明专利十余项,受邀担任 FSE、ICSE、ASE、TSE 等软件工程国际会议/期刊审稿人。曾获 FSE'25 以及 APSEC'24 杰出论文奖(Distinguished Paper Award)。近年来,主持国家自然科学基金青年基金、宁波甬江引才项目、字节跳动、支付宝、华为合作项目等国家级、省部级及企业横向课题多项。部分研究成果已经在支付宝、字节跳动和华为得到应用。
从多维感知到智能归因:AI Agent 在业务刻画与异常诊断中的实践
李 松
蚂蚁集团 高级测试开发工程师
内容简介:
在蚂蚁数字支付场景架构日益复杂、数据爆发式增长的背景下,传统的人工分析正面临效率低下、链路断裂及专家经验难以传承的挑战。“Agent智能归因诊断分析系统”,深度融合了大语言模型逻辑推理能力与智能算法的下一代决策平台。系统核心构建了一个具备“自主规划、工具调用、深度推理、归因分析”能力的AI智能体。当业务指标出现异常波动时,Agent能像资深专家一样,自动跨越系统孤岛,实时调用SQL、日志分析及因果模型进行多维下钻。
它不仅能精准定位问题的技术根因,还能将碎片化的数据串联为端到端的业务动线,生成技术业务都能看懂的可视化分析报告,实现从“看到波动”到“理解原因”的飞跃。有效打通了业务增长与技术保障之间的“最后一公里”。通过持续沉淀组织经验,助力质量同学从被动救火转向主动洞察,实现更高维度的数智化决策与运营范式。

演讲提纲:
1. 诊断困局:复杂链路下的“感知失真”与排查低效
1.1 痛点分析:系统复杂度提升与专家经验依赖的矛盾。
1.2 实战复盘:从“碰支付”案例看传统监控阈值的归因盲区。
1.3 破局思路:构建智能感知驱动、智能体协同的自动化诊断体系。
2. 核心框架:业务多维感知与“四层诊断”体系
2.1 架构设计:构建“看、定、溯、决”的一体化闭环能力。
2.2 动态刻画:从技术异常到用户体验动线的数据洞察分析。
2.3 智能降噪:利用 Agent 聚类分析实现“高风险信号”诊断归因。
3. 技术实现:Agent 智能诊断与 Canvas 动态报告
3.1 决策大脑:基于 ReAct 框架的自主规划、执行与自我修正。
3.2 工程攻坚:读SQL、查Trace、诊断Workflow等能力集成。
3.3 视觉驱动:基于skill约束上下文驱动Canvas可视化报告。
4. 实践落地:分钟级定位与分析资产闭环
4.1 量化收益:自动定位耗时从“小时级”跨入“分钟级”。
4.2 范式转移:从“人找结论”到“结论反哺SKILL”,降低专家资源依赖。
4.3 资产沉淀:实现“诊断-沉淀-自动防御”的经验自动化复用。
5. 总结与演进
5.1 总结:总结“感知+刻画+归因”的标准化诊断路径。
5.2 未来展望:从智能助手到诊断专家,实现“业务智能诊断”。

听众收益:
1. 了解大模型 Agent 在复杂系统场景下的落地实战:基于 ReAct 框架构建具备“逻辑脑”与“执行手”的智能体,如何攻克大模型推理幻觉及业务语义对齐等核心工程难点,获取可复制的 Agent 架构经验。
2. 获取从“人找结论”向“AI 喂结论”的效能突破方案:Agent 自动跨越系统孤岛,实现异动定位耗时从“小时级”到“分钟级”的跨越,实现从被动救火到主动洞察的范式转型。
3. “逻辑推理”与“Canvas 动态渲染”融合的可视化方案: Agent 如何通过定制 V-DSL 驱动 Canvas 引擎,将硬核的因果证据链转化为技术、业务双端通用的可视化诊断长图
同济大学控制工程硕士,现就职于蚂蚁集团,从事智能测试平台建设5年,深耕数字化场景下的质量保障与智能化探索。
京ICP备2020039808号-4 京公网安备11011202100922号