一块显卡理解一部电影,超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

内容摘要仅需1块80G显卡,大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。它借助语言模型(LLM)的原生能力对长视觉序列进行压缩,不仅保留了短视频

仅需1块80G显卡,大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。它借助语言模型(LLM)的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,而且在长视频理解上展现了

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

即将跳转到外部网站 安全性未知,是否继续 继续前往
 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1