深入探讨DeepSeek数据处理、数据质量和模型训练
王健宗
平安科技 副总工程师
智能金融前沿技术研究院 院长
研讨话题:
1. DeepSeek采用了哪些方法确保训练数据的质量和多样性?企业如何借鉴这些方法提升自有数据质量?
2. 如何构建高质量训练数据集以提升模型推理能力?如何用最少的数据和计算资源实现最佳效果?
3. 如何针对不同模态(图像、文本、视频)设计定制化数据增强策略?
4. DeepSeek模型在企业特定场景下的微调方法和最佳实践是什么?例如,根据任务类型选择最优优化器及学习率调度策略。
5. 如何建立涵盖完整性、准确性、一致性的评估指标,并通过自动化工具持续监控?
6. DeepSeek在代码理解和生成方面采用了哪些特殊的数据处理和训练方法?企业如何利用这些方法增强自有模型的编程能力?
7. 模型对长文本的处理能力源自哪些训练技巧?企业如何提升自有模型的长上下文理解能力?                                                                       
CLOSED MEETING
闭  门  会
知识工程如何在业务领域落地?
王昊奋
同济大学百人计划 特聘研究员
OpenKG发起人之一
AiDD峰会技术委员会成员
研讨话题:
1. 如何利用大模型等先进技术从海量非结构化文档中高效、准确地提取领域知识,降低人工参与度和成本?
2. 如何设计既利用知识图谱结构化优势又发挥大语言模型理解能力的混合架构?RAG实现中的最佳实践是什么?
3. 从开源组件到商业平台,知识工程技术栈的选型标准和集成方案有哪些?不同技术栈的性能和维护成本如何?
4. 如何设计可持续的知识库更新维护机制?知识版本控制、质量验证和冲突解决的最佳实践是什么?
5. 知识工程成果如何与现有业务系统无缝集成?有哪些成熟的API设计和服务架构模式?
6. 不同行业(金融、医疗、制造等)知识工程落地的特定挑战和成功经验有哪些?如何避开行业特定的陷阱                                                                                                                            
DS、QwQ等大模型开源给研发带来的机遇及落地实践
狄鹏
蚂蚁集团程序分析及智能负责人
中科院客座研究员
新南威尔士大学兼职高级讲师
研讨话题:
1. 进入“人人可以使用大模型”时代了吗?最大的机遇在哪里?
2. 如何在有限的企业计算资源下高效部署开源大模型?在不同硬件环境下的优化策略是什么?
3. 本地化部署中的数据安全与模型性能平衡策略?
4. 相比之前的大模型,使用DS、QwQ等大模型,生成的代码或测试用例等采纳率会有明显的提升吗?
5. 开源大模型如何与现有IDE、CI/CD流程和开发工具链无缝集成?需要开发哪些中间件或适配器?
6. 需要构建什么样的评估框架来持续监控大模型在企业场景中的表现?哪些指标最能反映实际业务价值?
7. 在端侧部署32B 参数模型,在某些芯片或场景上推理延迟达 800ms。如何通过量化、剪枝和硬件协同设计实现实时响应?                                                                                                                                                        
大模型赋能金融业务:从数字内容风控到智能开发的融合之道
李雨珂
网易易盾AI算法负责人
李冰冰
网易CodeWave解决方案负责人
研讨主题:金融AIGC安全攻防:构建大模型时代的数字内容风控体系
研讨要点:
1.AIGC安全防御的技术困局
2.弹性纵深防御技术架构
3.工程化实践关键突破
4.金融场景前沿防御技术展望


研讨主题:落地AI应用一站式智能开发平台,AI应用建设实践
研讨要点:
1.DeepSeek爆火,带来哪些影响?
2.落地AI应用的一站式智能开发平台
3.智能应用案例分享
     
                                                        
*注:成功报名峰会者,方可申请报名闭门会。
报名信息需经组委会审核,最终以报名成功通知为准。
感谢您的支持与配合!
京ICP备2020039808号-4 京公网安备11011202100922号