品玩7月10日讯,据 Arxiv 页面显示,谷歌近日联手康奈尔大学发布论文,推出一款用于评估大模型视频理解能力的实验协议 VideoGLUE。

VideoGLUE包含动作识别、时间定位和时空定位三项标准任务、八个不同的数据集以及四种针对下游任务调整基础模型的方法。
论文显示,针对六个基础模型的研究,任务专业化模型在视频理解方面明显表现更好,这与在自然语言和图像理解方面取得的成就大不相同。
谷歌联手康奈尔大学推出 VideoGLUE,评估模型视频理解能力
2023年7月10日品玩7月10日讯,据 Arxiv 页面显示,谷歌近日联手康奈尔大学发布论文,推出一款用于评估大模型视频理解能力的实验协议 VideoGLUE。
VideoGLUE包含动作识别、时间定位和时空定位三项标准任务、八个不同的数据集以及四种针对下游任务调整基础模型的方法。
论文显示,针对六个基础模型的研究,任务专业化模型在视频理解方面明显表现更好,这与在自然语言和图像理解方面取得的成就大不相同。
下载品玩App,比99.9%的人更先知道关于「AI大模型」的新故事
下载品玩App
比99.9%的人更先知道关于「AI大模型」的新故事
0 条评论
请「登录」后评论