内容简介:
大模型应用范式主要包含Prompt工程、SFT、RAG和Agents等形式。其中,RAG可以快速实现大模型在新业务场景的适配落地。此外,相较于SFT,RAG的训练成本更低,并且他还可以根据需要与Prompt 工程、SFT等方法进行结合调优,是大模型应用范式中的一个关键能力点,但RAG在使用过程中会存在知识库质量敏感、系统局部最优情况,对此我们引入RAG联合微调方法,提升RAG的整体效果,目前已在部门内部获得一定收益。
演讲提纲:
1. 目前大模型的发展现状以及应用范式
1.1大模型演进过程
1.2大模型应用范式
2. 国内外RAG现状分析
3. 目前RAG存在问题
3.1模块独立优化会陷入系统局部最优
3.2数据质量敏感
4. 如何重塑RAG数据新生态
4.1模块间联合微调方案
- 最大似然估计训练RAG辅助的LLM模型
- 基于强化微调的多组件联合微调
4.2数据质量评估手段
- 基于QA的知识冲突检测
- 基于语义的知识冗余检测
4.3应用示例
- 联合微调RAG在需求智能分级的应用
5. 思考与展望
听众收益:
1. 帮助听众了解大模型时代的发展现状以及应用范式
2. 增长听众对RAG架构的理解以及问题的分析
3.了解新颖的RAG联合微调框架
2020年硕士研究生毕业于华南理工大学,曾就职于阿里巴巴达摩院,2022年8月加入字节跳动,目前主要负责团队内NLP大模型算法研究工作,赋能团队相关业务。