Z-Image-Turbo- Controlnet

Z-Image-Turbo 모델이 예상보다는 더 큰 호평을 받고있다.

이미지 생성속도 , 이미지 품질, 다양한 text 구현 능력, 다국어 프롬프트 인식 여기에 오픈포즈를 이용하여 인물의 포즈도 쉽게 표현이 가능하다.

발빠르게 를 위한 Controlnet 모델이 나왔다.

모델이다.

좌 포즈 이미지를 이용하여 우측 결과 이미지를 얻었다.

ModelPatchLoader 노드에서 Z-Image-Turbo-Fun-Controlnet-Union 모델을 선택 입력단자들에는 써 있는 그대로 Model(Z-Image-Turbo), vae 를 연결한다.
QwenImageDiffsynthControlnet 노드의 Model 출력단자가 KSampler 노드의 입력단자에 연결해 주면 된다.
Strength 값은 0.65 ~ 0.8 사이를 사용 (권장)
가급적 프롬프트도 원하는 포즈에 맞는 프롬프트를 입력해 주면 더 정확한 포즈 이미지가 만들어 진다. 포즈를 프롬프트로 표현하기가 어려우면 chatGPT 또는 GEMINI 의 도움으로 프롬프트를 추출하면 된다.
Load Image 에 원하는 포즈의 사진이나 그림을 선택한다.

포즈 이미지
입력포즈
Prompt : Create a portrait of a beautiful korean young woman standing against a solid light blue background. She has long, dark, wavy hair and a fair complexion. She is wearing a strapless, fitted, light blue crop top and a matching high-waisted, form-fitting mini skirt. She is also wearing light blue high heels. Her pose is relaxed with her arms gently behind her back, and she has a neutral facial expression. The overall color palette is predominantly shades of blue, creating a harmonious and elegant aesthetic.
결과 이미지
결과 이미지
상당히 포즈가 비슷하게 만들어 졌다. 참고로 결과이미지는 xxx.png 파일 이미지 이기 때문에 그대로 다운로드하여 comfyui 화면에 Drag&Drop 시키면 사용된 workflow 가 그대로 재현된다.

Z-image-turbo 모델을 위한 다른 좋은 Lora 모델들도 많이 나온다면 다양하게 적용하여 원하는 이미지를 생성할 수 있을 것이다. 점점 더 대형 모델들이 출시되는 가운데 소형이면서 기능이 상당히 만족스런 모델은 Z-Image-Turbo 모델인 듯 하다.