刚刚,国际大模型竞技场LMArena发来祝贺:

最新文生图榜单显示,混元图像 3.0 在全球26个大模型中,高居第一位,超过nano-banana等顶尖闭源模型。

图片

这一结果来自全球所有用户的“盲测”,这也标志着混元在多模态生成方面达到全球领先水平。

腾讯混元图像 3.0 发布仅仅一周,就开启了全球“霸榜”模式。

不仅夺得文生图全球第一,在Hugging Face开源社区也受到了开发者的喜爱,持续一周稳居开源模型热榜第一。

图片

LMArena是美国加州大学伯克利分校推出的创新AI模型评估平台,评测核心方法是基于人类真实偏好的“盲测”机制,让用户对不同AI模型的回答进行匿名投票,衡量模型的表现。

用户输入问题后,平台提供两个模型的回答,用户根据偏好选择更优答案,投票结果直接塑造公共排行榜。由于该平台访问量巨大,并且评测机制贴近实际体验,是目前国际上最权威的竞技场榜单。

混元图像3.0是腾讯9月28日发布并开源的原生多模态生图模型。这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。

混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并具备极致美学质感,能生成真实的高质感图片;支持中英文文字生成,长文本文字渲染。

用户们也探索出了混元图像3.0的多种玩法:

比如,科普漫画@海辛和阿文

图片

Prompt:模仿毕加索的风格,绘制三个时期的毕加索自画像,并标注每个时期的名称。

节日海报@优设AIGC

图片

Prompt:平面插画,海报设计,高级感排版,新中式美学,中国当代艺术风格,新中式宋代主题,国风美学,高饱和渐变背景,超大的的满月与古代宫殿建筑的剪影居中,超大的的满月在建筑后面并占据大半画幅,满月边缘稍微虚化一点,不要太生硬,周围有一些小星星围绕,旁边还停留一只小玉兔,渐变和肌理磨砂处理,造型柔和,中式建筑,中式花纹,不透明和半透明质感,橙白渐变色,工笔画,层次感,弥散渐变,细节满满,左上方放标题“CHINESE TRADITIONAL FESTIVALS”.用细的衬线体,放大处理,在标题下放“中秋国庆”,下方还有“一轮明月恭贺华诞”,整个画面左下方放日期“10.01”和“10.06”,还有“2025”,日期部分有点缀小字“MID AUTUMN FESTIVAL NATIONAL DAY”,日期与点缀小字都用衬线体,底部左下角有“MID AUTUMN FESTIVAL”,极小号字体,横向排布底端左侧“Oct 1- Oct 06,2025”,极小号字体,横向排布;右下角“NATIONAL DAY”极小号字体,横向排布,统一用衬线体

人物摄影@歸藏的AI工具箱

图片

视觉设计@雪佬说

图片

prompt:这个方案旨在为一个专注于人文、艺术的独立书店设计一套视觉系统,强调安静、思辨的氛围。 【项目与概念】: 为独立书店“精神角落 (Spiritual Corner)”设计一套完整的品牌视觉识别系统,旨在传达阅读的宁静、思想的深度与社区的温暖。 【核心美学与风格】: 极简主义线条插画,融合了瑞士国际主义的排版。 【Logo与辅助图形】: Logo是一个由线条构成的、打开的书本,书本的轮廓同时形成了一个房子的屋顶。辅助图形包括线条画的台灯、钢笔、眼镜和咖啡杯。 【字体与色彩】: 品牌字体“精神角落”采用经典的、严谨的无衬线黑体(如Helvetica)。 主色调为代表理性的深蓝色和代表纸张的米白色。辅助色为黑色和灰色。 【物料延伸设计】: 海报: 通常以大面积的色块和一句引人深思的文字为主,图形点缀。 书签: 印有不同的线条辅助图形和作家名言。 帆布袋: 深蓝色帆布,印有白色的Logo和标语“Read, Think, Exist.”。 会员卡/名片: 极简的卡片设计,信息排版清晰。

还有网友问混元:“Who are you? Could you please create a self-portrait and write a message for me?” (你是谁?能画个自画像,再给我写句话吗?)

这是混元图像 3.0的答案:

Image

以上这些生图玩法,现在在混元官网和腾讯元宝都可以体验。

体验地址:https://hunyuan.tencent.com/modelSquare/home/play?from=modelSquare&modelId=289

混元图像3.0目前的版本已开放了文生图能力,图生图、图像编辑、多轮交互等版本也将于后续发布。 

多模态正在成为混元大模型的核心竞争力之一,混元3D与图像生成模型均处于行业顶尖水平。

在3D生成领域,8月上海人工智能实验室的全球3D生成模型评测榜单显示,混元3D模型在图生3D和文生3D任务中均位列第一;混元世界模型Voyager在斯坦福大学WorldScore基准测试中综合能力排名首位。

混元目前已形成语言、图像、视频、3D模型的多尺寸、多模态开源矩阵,提供接近商业模型性能的开源基座。图像、视频衍生模型数量总数达到3000个,混元3D系列模型社区下载量超过260万,是全球最受欢迎的3D开源模型。

最后,预祝大家:

image