智源FlagEval‌最新评测：腾讯混元文生图位列榜首-品玩

近日，智源研究院发布最新的FlagEval‌ 大模型评测排行榜。结果显示，在多模态模型评测榜单的文生图模型中，腾讯混元的文生图能力位居榜首。随后分别为字节跳动的豆包模型，以及国外Ideogram研发的文本生成图像模型 Ideogram 2.0。

（智源官网排行榜截图）

‌FlagEval‌是由北京智源人工智能研究院（BAAI）推出的大模型评测体系及开放平台，用于评估基础模型及训练算法的性能，评测范围涉及国内外100余个开源和商业闭源模型，覆盖大语言模型，视觉语言、文生图、文生视频、语音语言等多模态模型等领域。

据介绍，该文生图评测采用主观评测作为排名依据，客观评测数据仅供参考。主观评测从图文一致性、图片质量、美学质量和安全性四个维度进行人工打分，在最终主观排名里，这四个维度的权重分别5:2:2:1，以此分数作为最终主观排名分数。每张图片每个维度的得分由三个标注人员打分取平均得出。

腾讯混元的文生图能力目前全面对外开放，普通用户可通过腾讯AI助手应用腾讯元宝免费使用，企业用户和开发者可以通过腾讯云API调用该能力。此外，今年5月，混元文生图大模型也宣布升级并开源，已在 Hugging Face 平台及 Github 上发布，项目目前Github Stars已经达到3.7K。

腾讯混元文生图（HunyuanDiT）采用了与 sora 一致的DiT架构，是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解。

腾讯混元文生图能力，已广泛被用于素材创作、商品合成、游戏出图等多项业务场景中。基于腾讯混元的AI 广告创意平台腾讯广告妙思，可为广告主提供文生图、图生图、商品背景合成等多场景创意工具，有效提高广告生产及投放效率。《央视新闻》《新华日报》《深圳特区报》《南方都市报》《羊城晚报》等20余家媒体，也已经将腾讯混元文生图用于新闻内容生产。