内容
本文介绍使用Z-Image-Turbo配合ComfyUI的使用方法。
Z-Image-Turbo的优点:1. 较强的中文提示词跟随能力和汉字生成能力 2. 仅需8步推理即可生图,且参数量仅6B,配合量化可以在家用主机上运行(16G显存)。
竞争对手: Flux-2系列
考虑到某些地区无法使用ComfyUI-manager自动下载的网络限制,文件下载均以手动的方式。
前置准备工作
配置ComfyUI, 需要安装controlnet组件,可以额外安装llama-cpp-vlm文件来实现基于Qwen3-VL的图生文反推。如果需要查看反推的文本,可以安装comfyUI-custom-scripts。
注: Llama-cpp-vlm中需要的一个llama-cpp-python.whl插件的下载地址和下面和Qwen3-VL模型下载链接一并列出
需要下载的模型汇总
- Z-image-turbo三件套,下载链接里包含满血版和量化版,运行的时候diffusion_models和text_encoders可以选择量化版以节省显存开销。下载后以图中的方式放入comfyui的目录中: 模型下载链接

- ControlNet基础模型: 模型下载链接

- ControlNet 人物动作控制模型,需要body_pose_model.pth,hand_pose_model.pth和facenet.pth: 模型下载链接

- ControlNet 深度控制模型: 模型下载链接


常用的工作流搭建:
- 文生图

- 图生图(边缘检测)

- 图生图(人物姿势检测)

- 图生图(深度检测)

- 图生图(蒙版局域绘图)

- Qwen3-VL反推后文生图

可以直接使用的图片工作流示例(下载后直接导入):
- 基础版本

- controlnet版本

- qwen3-vl反推版本
