品玩1月31日讯,据 Arxiv 页面显示,华为近日联手香港大学,提出了一款名为 CompAgent的模型,用于解决组合文本到图像生成的问题。
CompAgent的核心思想是采用分而治之的方法,将复杂的文本提示分解为单个对象、属性和关系,然后独立地处理这些元素,最后将它们组合成最终的图像。
这种方法特别关注于确保生成的图像能够准确反映文本描述中的对象类型、属性和关系。
华为联手香港大学,发布图像生成模型CompAgent
1月31日品玩1月31日讯,据 Arxiv 页面显示,华为近日联手香港大学,提出了一款名为 CompAgent的模型,用于解决组合文本到图像生成的问题。
CompAgent的核心思想是采用分而治之的方法,将复杂的文本提示分解为单个对象、属性和关系,然后独立地处理这些元素,最后将它们组合成最终的图像。
这种方法特别关注于确保生成的图像能够准确反映文本描述中的对象类型、属性和关系。
下载品玩App,比99.9%的人更先知道关于「大模型」的新故事
下载品玩App
比99.9%的人更先知道关于「大模型」的新故事
0 条评论
请「登录」后评论