出品人:朱浩齐
网易易盾 总经理
网易数智副总经理、网易易盾总经理,同时也是网络生态治理领域的知名技术专家,拥有17年一线经验和理论沉淀。他带领的易盾团队是国内数字内容安全的领先服务商,专注内容安全、业务安全、应用安全等领域,近年来在AI技术安全方面积累丰富洞察和实践。

大模型安全与对齐

聚焦以大语言模型为代表的人工智能全生命周期安全,包括模型数据安全、算法安全、开发过程安全、部署安全、应用安全等,指引学术界和工业界合力实现AI可信,共建技术、社会、文化、价值融合共生的良性人工智能环境。    
LLM Agent安全攻防战:从架构风险到应用实战剖析
李文瑾
绿盟科技 天元实验室 负责人 
内容简介:
随着LLM Agent在产业应用的快速落地,其复杂的工作流架构正面临严峻的安全挑战。本议题将系统分析LLM Agent的技术风险,首先梳理当前主流的LLM应用形态演进路径,重点解构Agent架构中的安全薄弱环节。通过拆解工具调用链、记忆存储、决策验证等关键模块,揭示工具滥用、记忆污染等新型攻击面。议题将结合真实场景下的LLM Copilot实际案例,展示Prompt注入攻击如何通过Agent工作流实现攻击利用。最后探讨智能化时代下Agent安全的未来趋势,为构建可信Agent系统提供可落地的安全实践参考。        

演讲提纲:
1. 技术演进与风险图谱:LLM应用形态从Chat到Agent的安全升级挑战
2. 深度架构解构:Agent工作流中的高危攻击面分析
3. 红队视角实战:LLM Copilot应用场景下的攻击案例分析
4. 前沿趋势研判:Agent安全标准化与自动化对抗的未来方向

听众收益:
1. 掌握核心攻击链:系统认知Agent特有的工具调用、记忆污染等风险模式
2. 获得实战分析方法:通真实案例学习红队评估方法论
3. 预判未来威胁:洞察自主Agent进化可能引发的下一代安全危机

网络安全专业,任职于北京神州绿盟科技有限公司,绿盟科技安全能力中心技术总监、天元实验室负责人、M01N Team联合创建人。 负责攻防实战技术研究与能力建设,研究内容包括:漏洞利用技术、防御绕过技术、攻击隐匿技术、攻击持久化技术等红队技术,以及攻击技战术在工业互联网、大模型应用等实际业务场景下的威胁研究。
构建大模型时代的数字内容风控体系
李雨珂
网易易盾 AI算法负责人 
内容简介:
生成式AI重构内容生产范式的背景下,数字内容风控面临生成效率指数级提升、对抗性攻击隐蔽性增强、多模态数据融合复杂化等全新挑战。本次演讲基于真实业务场景下的对抗性经验解析AIGC和大模型场景下的安全防御体系设计,重点剖分享于高可控数据生成的基础防御模型训练、融基于模态特征的对齐敏捷风险检测、基于领域大模型的动态弹性防护等创新技术模块,并展示了对抗评练体系、搭建推理算力优擎等优化关键工程实践。围绕“持续对抗-免疫强化-弹性响应”的思路,通过构建覆盖数据层、模型层、决策层的立体化防御矩阵,新一代数字内容风控体系将逐渐实现从被动拦截到主动防御的技术跃迁,为AIGC时代数字内容治理提供可落地的算法与工程解决方案。        

演讲提纲:
1.AIGC安全防御的技术困局
1.1 生成式AI技术演进图谱
文本/图像/视频生成模型的代际发展(生成逻辑跃迁、语义理解差异)
生成质量与检测难度的""剪刀差效应""(生成质量提升速度>检测技术迭代速度)
1.2 新型安全威胁全景解析
新技术下攻防不对称性加剧
成本不对称(生成成本下降 vs 检测成本上升)
效率不对称(秒级生成 vs 分钟级级检测)
技术栈不对称(开源攻击 vs 闭源防御)
新技术下安全防御的技术深水区
对抗样本攻击(如Prompt注入导致模型输出越狱)
语义鸿沟问题(人类可识别但算法难检测的隐喻性违规内容)
2.弹性纵深防御技术架构
2.1 传统数字内容风控的技术架构演进
范式转变:规则引擎→ 机器学习→ 多模态大模型
能力断层:人工特征工程 vs 自动化表征学习
2.2 面向AIGC场景的技术架构升级
分层设计:数据层→ 算法层→ 策略层
闭环机制:攻防对抗数据自动回流训练系统
2.3 威胁感知:从手工收集到机器生产,提升新型样本获取的效率值
基于跨模态技术的检索、标注和生成
高可控高质量内容生成能力的加持
2.4 算法设计:从闭合任务到开放任务,提升新型风险识别的敏捷性
基于跨模态检索的少量样本识别
基于跨模态生成的精细粒度识别
基于开放域检测方案的敏捷识别
2.5 体系构建:从单一检测到综合能力,提升复杂风险治理的可控性
弹性防护:领域大模型技术托底的动态处理机制
纵深防御:在线实时检测和近实时巡检的结合
3.工程化实践关键突破
3.1 攻防对抗强化实践
防御鲁棒性评估方案
动态场景下的自适应调节策略
3.2 算法普惠化技术实践
线程级别的流水线并行推理框架
4.前沿防御技术展望
4.1 从分治到统一:多模型\多服务能力收敛到统一大模型
4.2 开源分享和社区共建

听众收益:
1.深入理解 AIGC 安全防御技术架构升级
听众可以了解到从传统数字内容风控技术架构向面向 AIGC 场景的技术架构升级的具体思路和方法,包括分层设计、闭环机制等关键要素,以及如何通过威胁感知、算法设计等方面的创新来提升新型风险识别的敏捷性和复杂风险治理的可控性。这将有助于他们在自己的工作中更好地应对 AIGC 带来的安全挑战,构建更有效的数字内容风控体系。
2.学习先进的工程化实践方法
演讲中提到的攻防对抗强化实践和算法普惠化技术实践等内容,为听众提供了在工程化层面应对 AIGC 安全问题的具体实践经验。例如,防御鲁棒性评估方案、动态场景下的自适应调节策略以及线程级别的流水线并行推理框架等,这些实践经验可以直接应用到听众的实际工作中,提高他们在 AIGC 安全防御方面的工程化水平和效率。
3.洞察前沿防御技术发展趋势
通过演讲中对前沿防御技术的展望,听众可以了解到 AIGC 安全领域未来的发展方向,如从分治到统一的多模型多服务能力收敛到统一大模型的趋势,以及开源分享和社区共建的重要性。这将帮助听众提前布局和规划自己在 AIGC 安全领域的技术发展路径,保持在行业内的竞争力。

网易数智算法专家,信通院专家委员会成员,目前负责数字内容风控领域的人工智能算法研究,曾获得浙江省科学技术进步奖一等奖、中国人工智能产业发展联盟年度创新人物等奖项,所带团队多次在音视频伪造检测、大模型安全等领域的人工智能算法竞赛中获得最高荣誉,拥有多项数字安全领域的发明专利并发表多篇国际期刊和会议论文。
AI驱动的安全知识图谱自动构建与推理
邢 颖
北京邮电大学 副教授 
内容简介:
本演讲聚焦安全知识图谱在漏洞挖掘与图谱优化中的应用。首先基于知识图谱开展漏洞挖掘研究,以CCleaner、SolarWinds等供应链攻击事件为背景,构建技术框架,应用于ATT&CK威胁建模等多场景;接着借助扩散模型优化知识图谱,通过去噪提升漏洞检测准确性;最后介绍知识图谱自动构建技术,利用大语言模型实现漏洞知识图谱自动化构建,提升效率、降低专业门槛,为开源软件供应链安全提供解决方案。 
       
演讲提纲:
1.研究背景与意义
1.1CCleaner、SolarWinds等真实攻击案例揭示漏洞传播风险;
1.2安全知识图谱作为安全知识的高效组织形式,整合多源数据,支持威胁建模、风险分析与攻击推理。
2.基于知识图谱的漏洞挖掘研究
2.1安全知识图谱典型应用场景介绍:包括ATT&CK威胁建模、APT威胁追踪、企业智能安全运营等;
2.2提出MVP Detector模型:通过元路径构建、语义拓扑嵌入、分层特征聚合,实现开源组件漏洞预测;
2.3在VulKG 数据集上验证有效性。
3.基于扩散模型的知识图谱优化
3.1知识图谱噪声问题:无价值信息导致嵌入效果下降、信息噪声增加,且影响学习效率;
3.2提出DHV框架:结合扩散模型和异构图神经网络,识别关键属性,去除噪声边;
3.3在VulKG和MSR数据集上验证有效性。
4.知识图谱自动构建技术
4.1基于大语言模型的知识图谱自动构建:利用LLMs实现全流程自动化的知识图谱抽取;
4.2流程介绍:数据预处理->信息提取->知识后处理->构建知识图谱->知识交互;
4.3在漏洞文本描述中成功抽取知识,构建安全知识图谱。
5.总结与展望
5.1总结知识图谱在漏洞挖掘、图谱优化、自动化构建中的技术与应用;
5.2展望未来的发展方向和应用前景。

听众收益
1.通过真实案例,学习利用安全知识图谱整合多源数据,构建漏洞传播模型,了解漏洞挖掘的新技术、新方法;
2.深入理解扩散模型与图神经网络结合的去噪技术,掌握通过过滤知识图谱噪声边提升漏洞检测准确率的方法;
3.掌握基于大语言模型的漏洞知识图谱自动化构建技术,从数据预处理到人机交互全流程实践,降低人工成本与专业门槛。

中国人工智能学会会员、CCF高级会员、CCF软件工程专委会副秘书长、国家自然科学基金同行评议专家,并担任STVR、JCST、IST、JSS、IOTJ、《软件学报》、《电子学报》等期刊审稿人。研究领域包括软件供应链安全、安全漏洞检测、大模型应用等方面。先后主持了中国博士后科学基金、国家自然科学基金青年科学基金项目等,并作为项目骨干参加了多个国家级项目的研究,在软件工程、信息安全、人工智能相关的顶级期刊与会议发表论文80余篇,出版专著《源代码分析》、《基于人工智能的测试用例自动生成与测试用例集优化》、《Web网站自动化测试》、《面向对象软件工程》等。
京ICP备2020039808号-4 京公网安备11011202100922号