陈涛团队与腾讯联合推出电影生成和理解大模型

发布时间:2024-03-22 

  近日,复旦大学信息科学与工程学院陈涛老师课题组联合校内工研院范佳媛老师,以及腾讯(上海)研究团队联合提出了MovieLLM,一个创新性的AI电影合成和理解框架。MovieLLM采用了创新性的方法,不仅可以生成高质量、多样化的电影连续帧数据,而且能自动生成大量与之相关的问答数据,减少了获取该类数据集的人力投入,极大地方便了电影和视频理解大模型的训练。该工作获得国内外众多媒体包括新浪、AIminds、机器之心等关注和报道,也在电影从业领域引起较大反响。

  近年来陈涛老师课题组在围绕高效多模态大模型训练和推理方面做了一系列探索工作,包括MotionGPT、LLM3DA等多个三维场景合成与理解大模型,先后发表在NeurIPS、CVPR等领域内顶级会议上。未来陈涛老师课题组将继续围绕大模型在多粒度任务表征学习与决策生成方面展开研究,充分利用大模型的丰富知识和强大推理能力,实现大模型在机器人与无人自主系统等领域的更好应用。

原文链接:MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies (deaddawn.github.io)