品玩1月3日讯,据 AI base 报道,字节跳动近日开源新款文生图大模型Infinity,并表示该模型在生成质量上超越了Stable Diffusion3。
据悉,Infinity模型的核心创新在于采用了Bitwise Token的自回归框架,这一框架通过预测下一级分辨率的+1或-1构成的细粒度“Bitwise Token”,显著提升了模型对高频信号的捕捉能力,从而生成细节更加丰富的图像。此外,Infinity模型将词表扩展到无穷大,极大地增强了Image tokenizer的表示空间,提高了自回归文生图的性能上限。
在性能对比中,Infinity模型在自回归方法中表现突出,远超HART、LlamaGen、Emu3等方法,并在人类评测中以接近90%的胜率击败了HART模型。
0 条评论
请「登录」后评论