Qwen2512 - fp8

Qwen2512

CHECKPOINT
Original


Updated:

在Qwen-Image-2512 中,人物描绘得到了显著优化。与8 月发布的版本相比,Qwen-Image-2512 增加了更丰富的面部细节,并更好地呈现了环境背景。例如:

一位约20 岁的中国女大学生,发型非常短,散发出温柔而富有艺术气息的感觉。她的头发自然垂落,部分遮住脸颊,展现出一种假小子般却又迷人的气质。她拥有冷色调的白皙肌肤和精致的五官,表情略带羞涩却暗含自信——嘴角微微歪起,带着俏皮而青春的笑容。她穿着一件露肩上衣,露出一侧肩膀,身材比例匀称。画面为一张特写自拍照:她占据前景主体位置,背景清晰可见她的宿舍——上铺是一张整理整齐的床铺,铺着白色床单;书桌整洁有序,文具摆放规整;还有木制柜子和抽屉。照片由智能手机在柔和均匀的环境光下拍摄,色调自然、清晰度高,充满明亮活泼、洋溢着青春日常气息的氛围。

对于相同的提示词,Qwen-Image-2512 生成的面部特征明显更加逼真,背景中的物品(如书桌、文具和床上用品)也比Qwen-Image 清晰得多。

一位20 岁的东亚女孩,五官精致可爱,拥有一双大而明亮的棕色眼睛——眼神生动活泼,面带愉快或微微含笑的表情。她自然卷曲的长发要么披散着,要么扎成双马尾。皮肤白皙,妆容清淡,突出其青春活力。她身穿现代风格的可爱连衣裙或宽松休闲装,颜色明亮柔和——面料轻盈,剪裁简约。她站在动漫展的室内环境中,周围环绕着横幅、海报或摊位。照明为典型的室内灯光——非刻意布光,整张图像看起来像随手用iPhone 拍摄的照片:构图朴实无华,却洋溢着鲜活、清新、青春的魅力。

在此例中,发丝成为关键差异点:Qwen-Image 的8 月版本倾向于将发丝模糊成一片,丢失了精细细节,而Qwen-Image-2512 则能精准渲染每一根发丝,呈现出更自然、更真实的效果。

另一个案例:

一名东亚少年,年龄在15至18岁之间,拥有柔软蓬松的黑色短发和精致的面部轮廓。他那双大而温暖的棕色眼睛闪烁着活力。白皙的皮肤与阳光、开朗的笑容展现出平易近人、友善的气质——无妆容或瑕疵。他身穿蓝白相间的夏季校服衬衫,略微解开几颗纽扣,面料轻薄透气,黑色耳机挂在脖子上。双手插在口袋里,身体微微前倾,姿态放松,仿佛正在交谈。他身后是一处夏日校园操场:前景是茂密的绿草和红色橡胶跑道,远处是模糊的教学楼,天空湛蓝,点缀着蓬松的白云。明亮通透的光线营造出一种欢快、无忧无虑的青春氛围。

在此示例中,Qwen-Image-2512 更好地遵循了语义指令——例如,提示词中明确指出“身体微微前倾”,Qwen-Image-2512 准确捕捉到了这一姿势,而其前代模型则未能做到。

一对70多岁的中国老年夫妇,身处整洁有序的家庭厨房中。女士面容慈祥,带着温暖的微笑,系着一条印花围裙;男士站在她身后,同样面带笑容,两人一同注视着炉灶上一锅冒着热气的包子。厨房明亮整洁,洋溢着温馨和谐的氛围。画面采用广角镜头拍摄,完整呈现人物及其周围环境。

这一对比鲜明地揭示了8月版与12月版模型之间的差距。原始Qwen-Image 难以准确呈现衰老的面部特征(如皱纹),导致出现不自然的“AI感”。相比之下,Qwen-Image-2512 精准捕捉了年龄相关的细节线索,显著提升了真实感。

更精细的自然细节

Qwen-Image-2512 增强的细节表现力不仅限于人物,还延伸至风景、野生动物等领域。例如:

一条青绿色的河流蜿蜒穿过葱郁的峡谷。厚厚的苔藓与茂密的蕨类植物覆盖着岩壁;多道瀑布从高处飞泻而下,被水雾笼罩。正午时分,阳光透过浓密的树冠洒落,在河面投下斑驳闪烁的光点。空气中弥漫着湿润清新的气息,充满原始丛林的蓬勃生机。画面中无人物、文字或人工痕迹。

并排对比可见,Qwen-Image-2512 在水流、植被和瀑布水雾方面展现出更高的保真度,并呈现出更丰富的绿色层次。另一个例子(海浪渲染):

黎明时分,薄雾笼罩着大海。一座古老的石砌灯塔矗立在悬崖边缘,其灯塔光芒在雾中若隐若现。黑色礁石被海浪猛烈拍打,激起阵阵白色浪花。天空在清冷朦胧的光线中泛出柔和的蓝紫色调——传递出孤寂与庄严壮丽之感。

毛发细节是另一大亮点——例如这张金毛寻回犬的肖像:

在柔和日光下户外拍摄的一张超写实金毛寻回犬特写。毛发细节极为精致:每根毛发清晰可辨,颜色从暖金色自然过渡至浅奶油色,发梢处有细腻的反光;微风轻拂,赋予毛发微妙的蓬松感。底毛柔软浓密,护毛则长而分明,层次清晰可见。双眼湿润且富有表现力;鼻头微湿,带有精细的高光。背景柔焦虚化,以突出狗狗真实可触的质感和生动的表情。

同样,在描绘粗犷野生动物时,纹理质量也有所提升——例如一只雄性盘羊:

一只雄性盘羊伫立在荒凉崎岖的山巅。它浓密粗糙的灰褐色被毛覆盖着强壮有力的肌肉身躯。最引人注目的是其巨大、厚实、向外螺旋生长的角——象征着野性的力量。它的目光警觉而锐利。背景展现出陡峭的高山地貌:嶙峋的山峰、稀疏的低矮植被以及充足的阳光——传达出严酷却壮美的荒野景象,以及动物坚韧的生命力。

改进的文字渲染能力

Qwen-Image-2512 在原本就已出色的文字渲染能力基础上进一步提升,增强了准确性、排版效果以及多模态融合能力。

例如,以下提示要求生成一张完整的PPT幻灯片,展示Qwen-Image 的发展路线图(包括生成与编辑两条路径):

这是一张现代风格的科技感幻灯片,整体采用深蓝色渐变背景。标题是“Qwen-Image发展历程”。下方一条水平延伸的发光时间轴,轴线中间写着“生图路线”。由左侧淡蓝色渐变为右侧深紫色,并以精致的箭头收尾。时间轴上每个节点通过虚线连接至下方醒目的蓝色圆角矩形日期标签,标签内为清晰白色字体,从左向右依次写着:“2025年5月6日Qwen-Image 项目启动”“2025年8月4日Qwen-Image 开源发布”“2025年12月31日Qwen-Image-2512 开源发布”(周围光晕显著)。在下方一条水平延伸的发光时间轴,轴线中间写着“编辑路线”。由左侧淡蓝色渐变为右侧深紫色,并以精致的箭头收尾。时间轴上每个节点通过虚线连接至下方醒目的蓝色圆角矩形日期标签,标签内为清晰白色字体,从左向右依次写着:“2025年8月18日Qwen-Image-Edit 开源发布”“2025年9月22日Qwen-Image-Edit-2509 开源发布”“2025年12月19日Qwen-Image-Layered 开源发布”“2025年12月23日Qwen-Image-Edit-2511 开源发布”

We can even generate a before-and-after comparison slide to highlight the leap from “AI-blurry” to “photorealistic”:

这是一张现代风格的科技感幻灯片,整体采用深蓝色渐变背景。顶部中央为白色无衬线粗体大字标题“Qwen-Image-2512重磅发布”。画面主体为横向对比图,视觉焦点集中于中间的升级对比区域。左侧为面部光滑没有任何细节的女性人像,质感差;右侧为高度写实的年轻女性肖像,皮肤呈现真实毛孔纹理与细微光影变化,发丝根根分明,眼眸透亮,表情自然,整体质感接近写实摄影。两图像之间以一个绿色流线型箭头链接。造型科技感十足,中部标注“2512质感升级”,使用白色加粗字体,居中显示。箭头两侧有微弱光晕效果,增强动态感。在图像下方,以白色文字呈现三行说明:“● 更真实的人物质感。大幅度降低了生成图片的AI感,提升了图像真实性● 更细腻的自然纹理。大幅度提升了生成图片的纹理细节。风景图,动物毛发刻画更细腻。● 更复杂的文字渲染。大幅提升了文字渲染的质量。图文混合渲染更准确,排版更好”

A more complex infographic example:

这是一幅专业级工业技术信息图表,整体采用深蓝色科技感背景,光线均匀柔和,营造出冷静、精准的现代工业氛围。画面分为左右两大板块,布局清晰,视觉层次分明。左侧板块标题为“实际发生的现象”,以浅蓝色圆角矩形框突出显示,内部排列三个深蓝色按钮式条目,第一个条目展示一堆棕色粉末状原料上滴落水滴的图标,文字为“团聚/结块”,后面配有绿色对钩;第二个条目为一个装有蓝色液体并冒出气泡的锥形瓶,文字为“产生气泡/缺陷”,后面配有绿色对钩;第三个条目为两个生锈的齿轮,文字为“设备腐蚀/催化剂失活”,后面配有绿色对钩。右侧板块标题为“【不会】发生的现象”,使用米黄色圆角矩形框呈现,内部四个条目均置于深灰色背景方框中。图标分别为:一组精密啮合的金属齿轮,文字为“反应效率【显著提高】”,上方覆盖醒目的红色叉号;一捆整齐排列的金属管材,文字为“成品内部【绝对无气泡/孔隙】”,上方覆盖醒目的红色叉号;一条坚固的金属链条正在承受拉力,文字为“材料强度与耐久性【得到增强】”,上方覆盖醒目的红色叉号;一堆腐蚀的扳手,文字为“加工过程【零腐蚀/零副反应风险】”,上方覆盖醒目的红色叉号。底部中央有一行小字注释:“注:水分的存在通常会导致负面或干扰性的结果,而非理想或增强的状态”,字体为白色,清晰可读。整体风格现代简约,配色对比强烈,图形符号准确传达技术逻辑,适合用于工业培训或科普演示场景。

Or even a full educational poster:

这是一幅由十二个分格组成的3×4网格布局的写实摄影作品,整体呈现“健康的一天”主题,画面风格简洁清晰,每一分格独立成景又统一于生活节奏的叙事脉络。第一行分别是“06:00 晨跑唤醒身体”:面部特写,一位女性身穿灰色运动套装,背景是初升的朝阳与葱郁绿树;“06:30 动态拉伸激活关节”:女性身着瑜伽服在阳台做晨间拉伸,身体舒展,背景为淡粉色天空与远山轮廓;“07:30 均衡营养早餐”:桌上摆放全麦面包、牛油果和一杯橙汁,女性微笑着准备用餐;“08:00 补水润燥”:透明玻璃水杯中浮有柠檬片,女性手持水杯轻啜,阳光从左侧斜照入室,杯壁水珠滑落;第二行分别是:“09:00 专注高效工作”:女性专注敲击键盘,屏幕显示简洁界面,身旁放有一杯咖啡与一盆绿植;“12:00 静心阅读时光”:女性坐在书桌前翻阅纸质书籍,台灯散发暖光,书页泛黄,旁放半杯红茶;“12:30 午后轻松漫步”:女性在林荫道上漫步,脸部特写;“15:00 茶香伴午后”:女性端着骨瓷茶杯站在窗边,窗外是城市街景与飘动云朵,茶香袅袅;第三行分别是:“18:00 运动释放压力”:健身房内,女性正在练习瑜伽;“19:00 美味晚餐”:女性在开放式厨房中切菜,砧板上有番茄与青椒,锅中热气升腾,灯光温暖;“21:00 冥想助眠”:女性盘腿坐在柔软地毯上冥想,双手轻放膝上,闭目宁静;“21:30 进入睡眠”:女性躺在床上休息。整体采用自然光线为主,色调以暖白与米灰为基调,光影层次分明,画面充满温馨的生活气息与规律的节奏感。

Version Detail

Qwen-Image
在Qwen-Image-2512 中,人物描绘得到了显著优化。与8 月发布的版本相比,Qwen-Image-2512 增加了更丰富的面部细节,并更好地呈现了环境背景。例如: 一位约20 岁的中国女大学生,发型非常短,散发出温柔而富有艺术气息的感觉。她的头发自然垂落,部分遮住脸颊,展现出一种假小子般却又迷人的气质。她拥有冷色调的白皙肌肤和精致的五官,表情略带羞涩却暗含自信——嘴角微微歪起,带着俏皮而青春的笑容。她穿着一件露肩上衣,露出一侧肩膀,身材比例匀称。画面为一张特写自拍照:她占据前景主体位置,背景清晰可见她的宿舍——上铺是一张整理整齐的床铺,铺着白色床单;书桌整洁有序,文具摆放规整;还有木制柜子和抽屉。照片由智能手机在柔和均匀的环境光下拍摄,色调自然、清晰度高,充满明亮活泼、洋溢着青春日常气息的氛围。 对于相同的提示词,Qwen-Image-2512 生成的面部特征明显更加逼真,背景中的物品(如书桌、文具和床上用品)也比Qwen-Image 清晰得多。 一位20 岁的东亚女孩,五官精致可爱,拥有一双大而明亮的棕色眼睛——眼神生动活泼,面带愉快或微微含笑的表情。她自然卷曲的长发要么披散着,要么扎成双马尾。皮肤白皙,妆容清淡,突出其青春活力。她身穿现代风格的可爱连衣裙或宽松休闲装,颜色明亮柔和——面料轻盈,剪裁简约。她站在动漫展的室内环境中,周围环绕着横幅、海报或摊位。照明为典型的室内灯光——非刻意布光,整张图像看起来像随手用iPhone 拍摄的照片:构图朴实无华,却洋溢着鲜活、清新、青春的魅力。 在此例中,发丝成为关键差异点:Qwen-Image 的8 月版本倾向于将发丝模糊成一片,丢失了精细细节,而Qwen-Image-2512 则能精准渲染每一根发丝,呈现出更自然、更真实的效果。 另一个案例: 一名东亚少年,年龄在15至18岁之间,拥有柔软蓬松的黑色短发和精致的面部轮廓。他那双大而温暖的棕色眼睛闪烁着活力。白皙的皮肤与阳光、开朗的笑容展现出平易近人、友善的气质——无妆容或瑕疵。他身穿蓝白相间的夏季校服衬衫,略微解开几颗纽扣,面料轻薄透气,黑色耳机挂在脖子上。双手插在口袋里,身体微微前倾,姿态放松,仿佛正在交谈。他身后是一处夏日校园操场:前景是茂密的绿草和红色橡胶跑道,远处是模糊的教学楼,天空湛蓝,点缀着蓬松的白云。明亮通透的光线营造出一种欢快、无忧无虑的青春氛围。 在此示例中,Qwen-Image-2512 更好地遵循了语义指令——例如,提示词中明确指出“身体微微前倾”,Qwen-Image-2512 准确捕捉到了这一姿势,而其前代模型则未能做到。 一对70多岁的中国老年夫妇,身处整洁有序的家庭厨房中。女士面容慈祥,带着温暖的微笑,系着一条印花围裙;男士站在她身后,同样面带笑容,两人一同注视着炉灶上一锅冒着热气的包子。厨房明亮整洁,洋溢着温馨和谐的氛围。画面采用广角镜头拍摄,完整呈现人物及其周围环境。 这一对比鲜明地揭示了8月版与12月版模型之间的差距。原始Qwen-Image 难以准确呈现衰老的面部特征(如皱纹),导致出现不自然的“AI感”。相比之下,Qwen-Image-2512 精准捕捉了年龄相关的细节线索,显著提升了真实感。 更精细的自然细节 Qwen-Image-2512 增强的细节表现力不仅限于人物,还延伸至风景、野生动物等领域。例如: 一条青绿色的河流蜿蜒穿过葱郁的峡谷。厚厚的苔藓与茂密的蕨类植物覆盖着岩壁;多道瀑布从高处飞泻而下,被水雾笼罩。正午时分,阳光透过浓密的树冠洒落,在河面投下斑驳闪烁的光点。空气中弥漫着湿润清新的气息,充满原始丛林的蓬勃生机。画面中无人物、文字或人工痕迹。 并排对比可见,Qwen-Image-2512 在水流、植被和瀑布水雾方面展现出更高的保真度,并呈现出更丰富的绿色层次。另一个例子(海浪渲染): 黎明时分,薄雾笼罩着大海。一座古老的石砌灯塔矗立在悬崖边缘,其灯塔光芒在雾中若隐若现。黑色礁石被海浪猛烈拍打,激起阵阵白色浪花。天空在清冷朦胧的光线中泛出柔和的蓝紫色调——传递出孤寂与庄严壮丽之感。 毛发细节是另一大亮点——例如这张金毛寻回犬的肖像: 在柔和日光下户外拍摄的一张超写实金毛寻回犬特写。毛发细节极为精致:每根毛发清晰可辨,颜色从暖金色自然过渡至浅奶油色,发梢处有细腻的反光;微风轻拂,赋予毛发微妙的蓬松感。底毛柔软浓密,护毛则长而分明,层次清晰可见。双眼湿润且富有表现力;鼻头微湿,带有精细的高光。背景柔焦虚化,以突出狗狗真实可触的质感和生动的表情。 同样,在描绘粗犷野生动物时,纹理质量也有所提升——例如一只雄性盘羊: 一只雄性盘羊伫立在荒凉崎岖的山巅。它浓密粗糙的灰褐色被毛覆盖着强壮有力的肌肉身躯。最引人注目的是其巨大、厚实、向外螺旋生长的角——象征着野性的力量。它的目光警觉而锐利。背景展现出陡峭的高山地貌:嶙峋的山峰、稀疏的低矮植被以及充足的阳光——传达出严酷却壮美的荒野景象,以及动物坚韧的生命力。 改进的文字渲染能力 Qwen-Image-2512 在原本就已出色的文字渲染能力基础上进一步提升,增强了准确性、排版效果以及多模态融合能力。 例如,以下提示要求生成一张完整的PPT幻灯片,展示Qwen-Image 的发展路线图(包括生成与编辑两条路径): 这是一张现代风格的科技感幻灯片,整体采用深蓝色渐变背景。标题是“Qwen-Image发展历程”。下方一条水平延伸的发光时间轴,轴线中间写着“生图路线”。由左侧淡蓝色渐变为右侧深紫色,并以精致的箭头收尾。时间轴上每个节点通过虚线连接至下方醒目的蓝色圆角矩形日期标签,标签内为清晰白色字体,从左向右依次写着:“2025年5月6日Qwen-Image 项目启动”“2025年8月4日Qwen-Image 开源发布”“2025年12月31日Qwen-Image-2512 开源发布”(周围光晕显著)。在下方一条水平延伸的发光时间轴,轴线中间写着“编辑路线”。由左侧淡蓝色渐变为右侧深紫色,并以精致的箭头收尾。时间轴上每个节点通过虚线连接至下方醒目的蓝色圆角矩形日期标签,标签内为清晰白色字体,从左向右依次写着:“2025年8月18日Qwen-Image-Edit 开源发布”“2025年9月22日Qwen-Image-Edit-2509 开源发布”“2025年12月19日Qwen-Image-Layered 开源发布”“2025年12月23日Qwen-Image-Edit-2511 开源发布” We can even generate a before-and-after comparison slide to highlight the leap from “AI-blurry” to “photorealistic”: 这是一张现代风格的科技感幻灯片,整体采用深蓝色渐变背景。顶部中央为白色无衬线粗体大字标题“Qwen-Image-2512重磅发布”。画面主体为横向对比图,视觉焦点集中于中间的升级对比区域。左侧为面部光滑没有任何细节的女性人像,质感差;右侧为高度写实的年轻女性肖像,皮肤呈现真实毛孔纹理与细微光影变化,发丝根根分明,眼眸透亮,表情自然,整体质感接近写实摄影。两图像之间以一个绿色流线型箭头链接。造型科技感十足,中部标注“2512质感升级”,使用白色加粗字体,居中显示。箭头两侧有微弱光晕效果,增强动态感。在图像下方,以白色文字呈现三行说明:“● 更真实的人物质感。大幅度降低了生成图片的AI感,提升了图像真实性● 更细腻的自然纹理。大幅度提升了生成图片的纹理细节。风景图,动物毛发刻画更细腻。● 更复杂的文字渲染。大幅提升了文字渲染的质量。图文混合渲染更准确,排版更好” A more complex infographic example: 这是一幅专业级工业技术信息图表,整体采用深蓝色科技感背景,光线均匀柔和,营造出冷静、精准的现代工业氛围。画面分为左右两大板块,布局清晰,视觉层次分明。左侧板块标题为“实际发生的现象”,以浅蓝色圆角矩形框突出显示,内部排列三个深蓝色按钮式条目,第一个条目展示一堆棕色粉末状原料上滴落水滴的图标,文字为“团聚/结块”,后面配有绿色对钩;第二个条目为一个装有蓝色液体并冒出气泡的锥形瓶,文字为“产生气泡/缺陷”,后面配有绿色对钩;第三个条目为两个生锈的齿轮,文字为“设备腐蚀/催化剂失活”,后面配有绿色对钩。右侧板块标题为“【不会】发生的现象”,使用米黄色圆角矩形框呈现,内部四个条目均置于深灰色背景方框中。图标分别为:一组精密啮合的金属齿轮,文字为“反应效率【显著提高】”,上方覆盖醒目的红色叉号;一捆整齐排列的金属管材,文字为“成品内部【绝对无气泡/孔隙】”,上方覆盖醒目的红色叉号;一条坚固的金属链条正在承受拉力,文字为“材料强度与耐久性【得到增强】”,上方覆盖醒目的红色叉号;一堆腐蚀的扳手,文字为“加工过程【零腐蚀/零副反应风险】”,上方覆盖醒目的红色叉号。底部中央有一行小字注释:“注:水分的存在通常会导致负面或干扰性的结果,而非理想或增强的状态”,字体为白色,清晰可读。整体风格现代简约,配色对比强烈,图形符号准确传达技术逻辑,适合用于工业培训或科普演示场景。 Or even a full educational poster: 这是一幅由十二个分格组成的3×4网格布局的写实摄影作品,整体呈现“健康的一天”主题,画面风格简洁清晰,每一分格独立成景又统一于生活节奏的叙事脉络。第一行分别是“06:00 晨跑唤醒身体”:面部特写,一位女性身穿灰色运动套装,背景是初升的朝阳与葱郁绿树;“06:30 动态拉伸激活关节”:女性身着瑜伽服在阳台做晨间拉伸,身体舒展,背景为淡粉色天空与远山轮廓;“07:30 均衡营养早餐”:桌上摆放全麦面包、牛油果和一杯橙汁,女性微笑着准备用餐;“08:00 补水润燥”:透明玻璃水杯中浮有柠檬片,女性手持水杯轻啜,阳光从左侧斜照入室,杯壁水珠滑落;第二行分别是:“09:00 专注高效工作”:女性专注敲击键盘,屏幕显示简洁界面,身旁放有一杯咖啡与一盆绿植;“12:00 静心阅读时光”:女性坐在书桌前翻阅纸质书籍,台灯散发暖光,书页泛黄,旁放半杯红茶;“12:30 午后轻松漫步”:女性在林荫道上漫步,脸部特写;“15:00 茶香伴午后”:女性端着骨瓷茶杯站在窗边,窗外是城市街景与飘动云朵,茶香袅袅;第三行分别是:“18:00 运动释放压力”:健身房内,女性正在练习瑜伽;“19:00 美味晚餐”:女性在开放式厨房中切菜,砧板上有番茄与青椒,锅中热气升腾,灯光温暖;“21:00 冥想助眠”:女性盘腿坐在柔软地毯上冥想,双手轻放膝上,闭目宁静;“21:30 进入睡眠”:女性躺在床上休息。整体采用自然光线为主,色调以暖白与米灰为基调,光影层次分明,画面充满温馨的生活气息与规律的节奏感。

Project Permissions

Reprinting is strictly prohibited

    Use Permissions

  • Use in 吐司 Online

  • As a online training base model on 吐司

  • Use without crediting me

  • Share merges of this model

  • Use different permissions on merges

    Commercial Use

  • Sell generated contents

  • Use on generation services

  • Sell this model or merges

Related Posts