Z-Image-Turbo 은 알리바바에서 출시한 초고속 텍스트 to 이미지 생성 모델이다.
이모델을 이용한 이미지 (1024x1024) 생성 속도는 대략 10초정도이다. 이것은 Stable Diffusion SDXL 버전과 비슷한 생성속도를 보여준다.
![]() |
| Z-Image-Turbo |
1. 모델의 종류
- Z image turbo : 현재 출시된 모델이며 사실적인 이미지 생성, 영어 및 중국어 이중 언어 텍스트 렌더링, 그리고 강력한 명령어 처리 성능에서 탁월한 성능을 발휘하는 모델이다.
- Z image base : Diffusion 모델이 아니고, 커뮤니티 중심의 미세 조정 및 맞춤형 개발의 잠재력을 최대한 발휘한다는 모델인데 출시 예정이다.
- Z image edit : 말 그대로 이미지를 편집 수정할 수 있는 모델로 출시 예정이다.
2. Z image turbo 모델의 특장점
- 6B 매개변수를 사용하는 강력하고 효율적인 이미지 생성 모델이다.
- 뛰어난 미적 품질을 유지하면서도 강력한 사실적인 이미지 생성 기능을 제공한다.
- 복잡한 중국어 및 영어 텍스트를 정확하게 렌더링하는 데 탁월하다. 물론 한국어도 잘 인식한다.
- 프롬프트 향상 기능은 모델에 추론 기능을 제공하여 표면적 설명을 넘어 근본적인 다양한 지식을 활용한다.
- 무엇보다도 저 성능의 로컬 컴퓨터에서도 이미지 생성을 빠르게 해준다.
3. 모델의 다운로드 및 설치
- Z image turbo : CIVITAI 사이트에서 검색하면 나온다. turbo 모델을 다운로드하여 사용하면 되는데 컴퓨터 성능이 부족하면 fp8 모델을 다운받아 사용해도 된다.
- Text Encoder : qwen-3-4b ( https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files/text_encoders ) 에서 다운 받으면된다. 없으면 구글 검색하여 찾으면 된다.
- VAE : 이것은 Flux1 에서 사용한 VAE 를 그대로 사용한다.
4. Workflow 구성
- Workflow 를 사용하기 전에 반드시 Comfyui 를 최신의 버전으로 업데이트를 해야 한다.
- Comfyui 의 Template 에 Image 메뉴에 Z-image-turbo Text to Image 가 있기 때문에 이것을 불러서 사용하면 된다.
- 이 Workflow를 불러오면 거기에서도 모델 ,Text Encoder 그리고 VAE 를 모두 쉽게 받을 수있다.

Workflow - 여러개의 노드가 압축되어있다.
5. 이미지 생성 결과
- prompt :
- A magazine cover photography of a smiling energetic 16-year-old Japanese girl with layered short hair, pushing a vintage bicycle in front of a retro mint green vending machine. Cheerful expression, lively posture, summer vibe. She wears a white T-shirt and denim overalls. Green grapes and a water cup in the bike basket. Background of messy telephone poles and nostalgic Japanese shop signs. Side sunlight creating a golden halo on her hair. Fujifilm Pro 400H style, grainy film texture, low saturation, slightly overexposed, cinematic composition, unique camera angle. Fashion editorial style, 8K resolution. Magazine cover layout with visible text: Large title “SUMMER” at the top. Small cover text: “Youth & Freedom”, “Tokyo Street Issue”, “Vol. 24 | August 2025”. Barcode at the bottom corner.
이것은 template 에 있는 그대로의 prompt 이다.
- image size : 1024 x 1024
이미지 생성속도는 8초 정도이며, text 를 잘 표현해 준다. 물론 모두 다 정확하게 나타낸것은 아니지만 SDXL 보다는 훨씬 잘 나타낸다.
1024x1024 size - Image size : 2048 x 2048 일 경우
4배의 크기도 매우 잘 만들어준다. 걸리는 시간은 32초이다.
2048 x 2048 - 프롬프트 : 20대 초반의 아름다운 한국 여성이 은은한 불빛이 비치는 침대에 편안하게 누워 있다. 따스한 에디슨 전구 램프 불빛이 그녀의 편안한 얼굴과 헝클어진 검은 머리카락 위로 어우러진다. 그녀는 테라코타, 차콜, 크림색의 질감이 있는 쿠션에 기대어 있다. 그녀의 의상은 더욱 은은하면서도 매혹적인 아이돌 나이트웨어 룩으로 바뀐다. 그녀는 곡선과 핏이 잘 맞는 검은색 돌고래 반바지를 입고 있는데, 탄탄하고 운동으로 다져진 엉덩이와 자연스럽게 어우러진다. 그녀의 상의는 이제 깊게 파인 크롭 반소매 티셔츠로, 여전히 세련되지만 눈에 띄게 더 드러난다. 네크라인은 이전보다 낮아져 부드러운 V자 곡선을 이루며, 가슴 윗부분과 자연스러운 가슴골을 강조하면서도 노골적인 부분은 드러내지 않는다. 침대위에는 하트 표시가 그려져 있으며 하트 안에 " 사랑해" 라고 쓰여져 있다.


댓글
댓글 쓰기