기본 콘텐츠로 건너뛰기

Z-Image-Turbo- Controlnet

Z-Image-Turbo 모델이 예상보다는 더 큰 호평을 받고있다.

이미지 생성속도 , 이미지 품질, 다양한 text 구현 능력, 다국어 프롬프트 인식  여기에 오픈포즈를 이용하여 인물의 포즈도 쉽게 표현이 가능하다.
발빠르게 Z-Image-Turbo 를 위한 Controlnet 모델이 나왔다. 

좌 포즈 이미지를  이용하여 우측 결과 이미지를 얻었다.

1. Z-Image-Turbo-Fun-Controlnet-Union 모델의 특징

  • 100만 개의 고품질 이미지 데이터세트에서 10,000단계에 걸쳐 처음부터 학습되었다.
  • Canny, HED, Depth, PoseMLSD를 포함한 다양한 제어 조건을 표준 ControlNet처럼 사용할 수 있다.
  • 적용 strength 는 0.65 ~ 0.8 정도가 적당하다.
  • 안정성 향상을 위해 자세한 프롬프트를 사용하는 것이 좋다.  가급적  원하는 이미지의 내용을 프폼프트에서도 사용해야 더 적용이 잘 된다는 뜻이다.

2. 모델 및 노드 다운로드

  • https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union/tree/main 에서 다운
  • 설치는 D:\ComfyUI\ComfyUI\models\model_patches 폴더에 설치한다.
  • 노드는 Comfyui 를 최신버전으로 업데이트 하면 된다.   최근에  Comfyui 뿐만 아니라 custom 노드들도 많이 업데이트가 수시로 이루어 지기 때문에 실행할 때 Comfyui Manager 를 통하여 Update All 을 자주 시켜주는 것이 좋다.  
  • 이 글에서는 Pose 만 다루려고 한다.  개인적으로 Open Pose 를 가장 애용하고 다른 controlnet 은 그다지 사용의 필요성을 느끼지 못하기 때문이다.

3.  Controlnet Workflow

Controlnet Workflow

  • ModelPatchLoader 노드에서 Z-Image-Turbo-Fun-Controlnet-Union 모델을 선택  입력단자들에는 써 있는 그대로 Model(Z-Image-Turbo), vae 를 연결한다.
  • QwenImageDiffsynthControlnet 노드의 Model 출력단자가 KSampler 노드의 입력단자에 연결해 주면 된다.
  • Strength 값은 0.65 ~ 0.8 사이를 사용 (권장)
  • 가급적 프롬프트도 원하는 포즈에 맞는 프롬프트를 입력해 주면 더 정확한 포즈 이미지가 만들어 진다.    포즈를 프롬프트로 표현하기가 어려우면 chatGPT 또는 GEMINI 의 도움으로 프롬프트를 추출하면 된다.
  • Load Image 에 원하는 포즈의 사진이나 그림을 선택한다.

4. 이미지 생성

  • 포즈 이미지  
    입력포즈

  • Prompt :  Create a portrait of a  beautiful korean young woman standing against a solid light blue background. She has long, dark, wavy hair and a fair complexion. She is wearing a strapless, fitted, light blue crop top and a matching high-waisted, form-fitting mini skirt. She is also wearing light blue high heels. Her pose is relaxed with her arms gently behind her back, and she has a neutral facial expression.  The overall color palette is predominantly shades of blue, creating a harmonious and elegant aesthetic.
  • 결과 이미지 
    결과 이미지

  • 상당히 포즈가 비슷하게 만들어 졌다.  참고로  결과이미지는 xxx.png 파일 이미지 이기 때문에 그대로 다운로드하여 comfyui 화면에 Drag&Drop 시키면 사용된 workflow 가 그대로 재현된다.

5. 다양한 포즈 예


  • 좌 포즈, 우 결과 이미지
    좌 이미지의 원본의 비율이 다르기 때문에 좌측이미지가 뚱뚱하게 보일 뿐이다.

  • 좌 포즈, 우 결과
    프롬프트도 포즈와 비슷하게 입력하면 거의 원하는 포즈대로 만들어 진다.

  • 좌 포즈, 우 결과
    앉아있는 포즈도 잘 나타난다.

  • 좌 포즈, 우 결과
    반드시 포즈대로 만들어 지는것은 아니지만 프롬프트와 strength 값을 조절하여 최선의 원하는 결과 이미지를 만들면된다.

6. 결론

Z-image-turbo 모델을 위한 다른 좋은 Lora 모델들도 많이 나온다면 다양하게 적용하여 원하는 이미지를 생성할 수 있을 것이다.   점점 더 대형 모델들이 출시되는 가운데 소형이면서 기능이 상당히 만족스런 모델은 Z-Image-Turbo 모델인 듯 하다.




 

댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...

이미지에서 프롬프트 추출하기 in Comfyui - QWEN3-VL

 이미지 또는 사진에서 Prompt(프롬프트)를 추출하여 사용하기 네이버, 구글 또는 핀터레스트 등의 사이트에서 마음에 드는 사진을 보고 비슷한 이미지를 만들고 싶을때,   그 사진을 보고 직접 그것을 프롬프트로 만들기가 어려운 일이다.  만들었다고 해도 그것을 이용하여 이미지를 생성해 보면 원하는 이미지와는 동 떨어진 이미지가 만들어지기 쉽다. 그래서 보통은 chatGPT 나 GEMINI 를 이용하여 이미지를 업로드하고 프롬프트를 만들어 달라고 하여 추출한다.  나도 이런 방식으로 종종 프롬프트를 추출하여 사용하곤 한다. 여기에서는 외부 도움을 받아 추출하는 대신  내 컴퓨터에서 추출하여 사용하는 방법이다. 1. 이미지에서 프롬프트 추출 예 Z-Image-Turbo 로 만든 이미지 위의 이미지에서 프롬프트를 추출 한다면...... chatGPT : A soft, elegant portrait of a young woman sitting on the floor, painting flowers with a brush and a palette. She wears a crisp white shirt with rolled-up sleeves and fitted blue jeans. Her long dark hair flows naturally as she focuses calmly on her artwork. A vase filled with colorful roses stands beside her. The scene has a warm beige background, smooth lighting, clean details, and a serene, gentle atmosphere. Ultra-high-definition, photorealistic illustration, soft shadows, pastel tones, refined skin texture, delicate rendering. G...