内容简介:
基于RAG&ToolUsing等关键技术构建的AI Agent体系凭借其显著减少幻觉、实现知识动态更新、保障隐私安全等核心优势,已成为AI Agent系统关键的技术基础设施。
本议题将重点探讨以AI Agent为核心的质量保障体系构建,从性能、效果等关键维度建立系统的评测方法论,提出覆盖Agent全生命周期的质量保障体系,该体系能够提供可复用的质量保障方法,最终实现智能体应用在企业复杂场景中的有效落地
演讲提纲:
1. AI Agent在蚂蚁数科的应用场景。
2. Agent质量保障的整体方法论策略。
3.Agent有标效果评测与无标效果评测的科学方法与标准化体系。
4. Agent性能测试的技术方法和评估标准。
5. Agent一站式质量平台建设与实践。
听众收益:
1. 评估与选择能力提升:学习AI Agent的评测方法和标准,有助于听众在实际工作中更好地评估不同解决方案的优劣,为项目选型或技术架构决策提供科学依据。
2. 技能与工具掌握:评测过程中涉及的评测数据处理、效果评估、性能压测等核心技能,为听众提供宝贵的实践机会,显著提升听众在AI领域的专业能力,同时深入理解相关工具和平台的建设思路。
专注于AI Agent评测、算法评测等质量平台建设平台建设,具备丰富的测试工具开发,质量效能平台实施和落地经验,目前在蚂蚁数科质量团队担任核心开发,主导AI评测平台的技术攻坚与创新方案探索。