Question 1

Z-Image (Base) 和 Z-Image Turbo 有什么区别？

Accepted Answer

Z-Image 是拥有 60 亿参数的原始基础模型，专注于提供最高的图像质量、最强的语义理解和最佳的微调潜力，适合专业创作和模型训练。而 Turbo 是基于 Base 的蒸馏版本，牺牲了极少量的细节以换取 8 步极速出图的能力。如果你追求极致画质或需要训练模型，请选择 Z-Image Base。

Question 2

Z-Image 的 S3-DiT 架构有什么优势？

Accepted Answer

传统的 DiT 架构通常将文本和图像分开处理，而 Z-Image 的 S3-DiT (Single-Stream) 架构让两者在每一层都进行深度交互。这使得模型在处理复杂的 Prompt（如"一只猫坐在红色的椅子上，旁边放着蓝色的球"）时，颜色和对象的绑定更加准确。

Question 3

Z-Image 支持 ControlNet 和 Adapter 吗？

Accepted Answer

是的，作为基础大模型，Z-Image 拥有强大的扩展性。我们平台已集成主流的控制插件，你可以结合 Pose、Canny 等条件进行精确控制。

Question 4

写 Z-Image 的提示词需要用"魔咒"格式吗？

Accepted Answer

不需要。与早期的 SD 1.5 需要堆砌大量 tag（如 best quality, masterpiece, 8k）不同，Z-Image 受益于 S3-DiT 架构，对自然语言的理解能力极强。你可以像通过对话一样描述画面（例如："一个穿着雨衣的女孩站在雨中的上海街头，霓虹灯倒映在水面上"）。当然，它也兼容传统的 Tag 写法，但自然语言能更好地发挥其逻辑优势。

Question 5

为什么我应该用 Z-Image Base 来训练我的 LoRA？

Accepted Answer

这是一个专业的选择。Turbo 模型经过了"蒸馏"处理，虽然速度快，但丢失了部分高维特征空间。Z-Image Base 保留了完整的 60 亿参数权重和特征细节，作为训练底座时，它能更好地"吸收"你的新数据，训练出的 LoRA 风格还原度更高，且泛化能力更强。

Question 6

Z-Image Base 需要使用 Negative Prompt (负向提示词) 吗？

Accepted Answer

依赖度很低。由于 Z-Image Base 是高质量的原生训练模型，本身不易生成崩坏的肢体或低质画面。通常情况下，留空 Negative Prompt 即可。如果你对画面有特殊排除需求（如"不要红色"），再进行填写。

Z-Image - 60亿参数 AI 图像生成 | 吐司

Z-Image AI Image Generator

提示词画廊

核心能力

6B 参数的极致细节

S3-DiT 单流架构

原生中英双语掌控

完美的微调基座

训练你自己的 Z-Image LoRA

常见问题

体验 60 亿参数的视觉震撼