出品人:屠要峰
中兴通讯 中心研究院副院长、CAAI理事,CCF数据库/信息存储专委会常委
中兴通讯中心研究院副院长,研究员,国务院特殊津贴专家,中国人工智能学会理事,中国计算机学会杰出会员、CCF数据库/信息存储专委会常委。28年大型软件系统研发经验,主持中兴通讯数据库、大数据及人工智能等方向的技术研究和产品研发。曾获国家科技进步二等奖一项、省部级科技一等奖3项,主持国家/省级科技项目多项,在学术期刊/会议发表论文50多篇。

智能存储与检索技术

在人工智能与大数据时代,智能存储与检索技术正成为数据价值挖掘的核心引擎。本论坛聚焦向量数据库、AI驱动的搜索技术以及高效存储解决方案,探讨如何应对海量数据的存储、索引与快速检索挑战。从向量化表征到语义搜索,从分布式存储架构到智能化查询优化,我们将深入剖析前沿技术趋势与落地实践,助力企业构建高效、智能的数据基础设施,释放AI时代的潜能。      
蚂蚁开源向量检索库 VSAG 介绍与应用分享
王翔宇
蚂蚁集团 技术专家 
内容简介:
向量检索在信息检索、推荐系统和语义匹配等领域发挥着重要作用。随着近两年 LLM 的发展和 RAG 架构的普及,向量检索技术面临着更多的挑战。我们围绕着这些背景,开发了向量检索库 VSAG 并于 2024 年 7 月在 GitHub 上开源。目前,VSAG 库已在蚂蚁集团内部大量使用。
本次分享,我们将介绍向量检索技术是什么、VSAG 检索库设计目标、当前具备的能力以及我们如何优化检索算法。并且,我们会结合当下最新的研究成果,分享在业务落地中的实践经验。

演讲提纲:
1. 向量检索技术介绍
2. VSAG 检索库介绍
3. 检索算法优化
4. 业务落地中的实践经验        

听众收益: 
通过参加本次分享,听众能够了解向量检索技术是如何工作的,向量检索领域的前沿算法,以及在 LLM 和 RAG 的背景下,如何提升回答质量和响应速度。        
开源向量数据库 Milvus 核心开发者,BigANN 21 Track 2 第一名团队成员。曾在 Zilliz 负责存储和 GPU 算法相关开发工作。
2023 年加入蚂蚁集团,主要负责蚂蚁向量检索算法研发以及千亿规模向量数据库在蚂蚁业务场景落地。对向量检索算法与系统有丰富经验。
向量检索全栈性能优化探讨
肖世海
华为 技术专家 
内容简介:
向量检索性能优化的潜在可能方向探讨和基于和学术界合作的成果分享。方向包括,向量检索索引构建、全内存检索、SSD+内存检索、异构硬件检索等的合作经验分享。        

演讲提纲:
1. 总体研究和布局思路
2. 向量检索索引构建思路探讨
3. 内存检索性能优化探索
4. SSD+内存检索性能优化探索
5. 多模态检索性能优化探索
6. 异构硬件检索性能优化探索

听众收益:
1. 向量检索性能优化潜在的研究方向;
2. 当前已有和学术界的成功合作案例分享;
中国深圳华为技术公司的高级研究员。他的研究课题包括大数据和机器学习的硬件软件协同设计。他拥有超过10年的学术合作经验,并获得超过10项国际专利。

Elasticsearch - AI 驱动的搜索引擎
刘晓国
Elastic中国社区 首席布道师 
内容简介:
传统的纯词汇搜索不能满足当今时代的需求,特别是在这个智能的时代。当代企业针对搜索提出语义搜索,也就是根据文字的语义来进行搜索,而不是简单的词汇匹配。另外,企业也针对图片,语音及视频等非文本数据搜索提出了要求。Elasticsearch 自 8.0 起,开始提供向量搜索(密集向量,稀疏向量)功能。它可以完美地解决文字语义搜索及多媒体数据的搜索需求。此外,向量搜索也并非完美,特别是针对文字搜索。Elastic 可以使用混合搜索(词汇搜索,密集向量,稀疏)进行多路召回并对最终结果进行排名。这种方法可以提供搜索的提高精度及召回率。在人工智能发展的今天,结合大模型,使用 GenAI 来针对搜索结果进行推理。由于企业数据或私有数据在每时每刻都在生成。大模型在缺乏上下文的情况下使用大模型来进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成).本议题将详细介绍 Elasticsearch 的向量搜索技术及如何使用它进行 RAG 的应用开发。        

演讲提纲:
1. 智能时代的搜索需求
   - 对语义搜索的需求,而不是简单的词汇匹配
   - 对多媒体数据的搜索,比如图片,声音及视频
   - 非结构化数据的搜索
   - 向量搜索带来的新的解决方案
2. Elasticsearch 向量搜索介绍
   - 向量搜索原理
   - 向量搜索种类(密集向量,稀疏向量)
   - 混合搜索介绍(多路召回,综合评分)
   - Elasticsearch 在向量搜索上的最新进展
3. RAG 实现原理
   - 如何使得大模型变得更聪明
   - RAG 的实现方法
4. 使用 Elasticsearch 在企业搜索中的案例分享
   - 高级 RAG 案例分享
   - Agentic RAG 案例分享

听众收益:
1.开发者充分了解 Elastic 所提供的向量搜索(密集向量及稀疏向量)
2.如何使用向量搜索及传统搜索来提高搜索的召回率及精度
3.展示 Elasticsearch 在向量搜索方面的最新更新以及 RAG 在企业搜索应用的的实现        
现为 Elastic 中国社区首席布道师。新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过电脑设计,汽车电子,计算机操作系统,通信,云实时事件处理等。从爱立信开始,诺基亚,Ubuntu 到现在的 Elastic,从事社区工作有将近 20 年的经历。
构建智能化Data+AI生态体系-驱动数据价值跃迁
周文超
阿里云 数据库事业部总监 
内容简介:
数据是Data +AI时代的核心资产,本次演讲聚焦“数据资产”到“AI价值放大”的关键链路,涵盖统一元数据管理和治理能力One Meta、面向多模数据的数据准备能力One Channel、以及面向Data+AI的数据开发和管理方案,赋能企业实现从数据治理到智能决策的全链路跃迁。

演讲提纲:
1.介绍Data+AI时代数据库智能化升级的构想和技术路线
2.介绍统一元数据管理和治理能力One Meta,提供开放、统一、多模态元数据平台
3.介绍面向多模数据的数据准备能力,重点介绍数据流入、数据分片、数据富化、语义嵌入能力
4.介绍以及面向Data+AI的数据开发能力,重点介绍Notebook、任务编排、Agent编排能力
5.介绍具体落地场景、案例和经验        

听众收益:
1.了解业界数据开发和管理的新兴技术和方向。
2.了解具体落地场景、案例和经验。        

国家级领军人才。现任阿里云数据库事业部总监,数据库生态工具与数据仓库负责人。曾任美国乔治城大学计算机系长聘教授,在国际顶级学术会议与期刊上发表论文70余篇,并长期担任国际顶级学术会议/期刊的编委和评审专家。获得美国国家自然科学基金NSF CAREER Award,ACM SIGMOD最佳博士论文奖,以及多项学术会议最佳论文、最佳系统展示奖等。
大模型时代的多模态AI数据库探索
魏 星
中兴通讯  AI数据库项目经理 
内容简介:
大模型时代文本、图像、声音、视频等异构数据的交织,使传统数据库面临前所未有的挑战:如何高效存储海量非结构化数据?如何实现跨模态内容的深度关联?又如何支撑大模型对复杂信息的实时检索与推理?本次演讲将聚焦多模态AI数据库的前沿探索。我们将解析在大模型应用的需求下,数据库如何突破单一模态的局限,优化多模态数据管理,融入模型训推能力,解决数据“存得下、找得准、用得活”的核心命题,为AI应用提供高质量的数据服务。        

演讲提纲:
Part-I:背景与动机、核心概念、系统概念
1. 背景与动机:大模型时代的“多模态数据风暴”。
1.1现象级挑战:
-数据爆炸:文本、图像、音频、视频等非结构化数据占比 >80%。
-大模型需求:跨模态关联理解(如GPT-4V、Gemini)、实时检索推理。
-传统数据库瓶颈:结构化存储失效、语义关联缺失、实时性不足。
1.2核心命题:海量异构数据的高效压缩与分布式存储、跨模态内容的语义对齐与精准检索、无缝对接大模型训练与推理管线。
2. 核心概念:多模数据融合、向量表示与嵌入、混合检索与重排序等。
3. 系统架构:EBASE AI数据库。
Part-II:关键技术选型、挑战与解决方案。
1. 核心挑战:模态异构性导致关联困难、海量数据实时检索延迟、与大模型协同效率低下等。
2. 关键技术:标量+向量+图+文本混合存储与检索、库内模型训推等。
Part-III:案例研究、未来工作、总结Q&A
1. 案例研究:EBASE AI数据库在云边端大模型应用中的使用场景。
2. 未来工作:数据库与Agent协作探讨、数据-模型协同演进。
3.总结展望:构建基于多模态AI数据的大模型“超级外脑”。

听众收益:
1.帮助听众了解大模型时代数据库的潜在发展方向和问题解决能力;
2.为听众给出了一套支持多模融合和库内训推的数据库系统架构;
3.带领听众提前探讨下一代AI数据库基础设施的先机。
现任中兴通讯AI数据库团队项目经理、技术预研经理、CCF数据库专委会执行委员。2021年博士毕业于华东师范大学,研究方向为AI数据库、分布式数据库系统、异构数据库系统,在CCF-A/B类会议和期刊上发表数十篇论文。
京ICP备2020039808号-4 京公网安备11011202100922号