品玩8月24日讯,据 Arxiv 页面显示,中国科学技术大学近日联手字节跳动,推出一款通用多模态大模型UniDoc。
据悉,UniDoc可以同时进行文本检测、识别、定位和理解。研究团队表示,UniDoc 是一种新型的多模态模型,配备了文本检测和识别功能,此外,UniDoc 利用任务之间的有益互动来提高每个任务的性能。为了实现 UniDoc的功能,研究团队在大型指令跟随数据集上进行统一的多模态指令调整。
实验结果表示,UniDoc 在多个具有挑战性的基准测试中均取得了最先进的成绩。

字节跳动联手中国科学技术大学,发布多模态大模型UniDoc
2023年8月24日品玩8月24日讯,据 Arxiv 页面显示,中国科学技术大学近日联手字节跳动,推出一款通用多模态大模型UniDoc。
据悉,UniDoc可以同时进行文本检测、识别、定位和理解。研究团队表示,UniDoc 是一种新型的多模态模型,配备了文本检测和识别功能,此外,UniDoc 利用任务之间的有益互动来提高每个任务的性能。为了实现 UniDoc的功能,研究团队在大型指令跟随数据集上进行统一的多模态指令调整。
实验结果表示,UniDoc 在多个具有挑战性的基准测试中均取得了最先进的成绩。
下载品玩App,比99.9%的人更先知道关于「arxiv」的新故事
下载品玩App
比99.9%的人更先知道关于「arxiv」的新故事
0 条评论
请「登录」后评论