内容简介:
在当前具身智能研究领域,各式各样的数据驱动的预训练模型均展现出很强的性能。这些模型无一例外地都具备标注数据多、模型体量大、模型精度高等特点。与数据驱动的监督学习方式不同,本报告将重点关注如何从多模态数据中提取表示通用概念和行为知识、从多模态模型中挖掘复用模型知识,以数据知识+模型知识的方式提升智能体导航和操作的泛化性和执行效率。最后,将简要展望未来研究趋势。
演讲提纲:
1.研究背景和动机,包括引入知识的动机和思路;
2.我们在知识驱动导航和操作方面的最新研究进展;
3.未来研究趋势展望。
听众收益:
1.清楚具身导航和操作的最新研究进展和挑战;
2.知识驱动的具身智能研究思路和关键。
国家优秀青年科学基金获得者,博士生导师。研究方向为多模态具身导航与操作,在相关领域的国内外期刊和会议上发表论文共计100余篇,曾获国内外学术会议最佳论文奖3项、国际主流竞赛冠军5项,担任IEEE TIP编委、CVPR/ICCV/WACV领域主席、CVPR/ICCV上3次多模态主题研讨会的共同组织主席。曾获得北京市自然科学一等奖、中国图象图形学学会青年科学家奖、中国科学院院长特别奖、NVIDIA创新研究奖等。