기본 콘텐츠로 건너뛰기

Z Image Base 모델 이 뭐지?

 이번에는 Z-Image-Base 모델이 출시 되었는데......

기존에 Z-image-Turbo 모델이 나와서 제법 간단하고 빠르고 유용하게 사용하기 좋았는데 이번에 Base 모델이 출시 된 것이다.
뭔가 출시 순서가 뒤집어진 느낌이 든다.   왜 이렇게 출시를 한것인지?
우선 2 가지 모델을 비교해 보고 Z-Image-Base 에 대하여 알아보자.

Z-Image-base 로 생성

1. Z-Image-Base vs Turbo

  • CFG : 프롬프트를 얼마만큼 적용하는가 하는 비중치
    • Base : CFG 를 4정도로 해서 조절가능
    • Turbo : 보통 1로 하는데 조정이 안되고 모델이 알아서 결정한다.
  • Steps : 생성 steps
    • Base : 28 ~ 50 까지 steps 이 높을 수록 세밀하게 프롬프트에 맞추어 생성
    • Turbo : 8 steps 로 빠르게 생성
  • Fintunablity : 미세조정 가능성
    • Base : Training 이나 Lora 학습이 가능
    • Turbo : 개조가 어려움
  • Negative Prompting : 부정프롬프트
    • Base : 부정프롬프트를 입력하면 반응을 잘하여 제거하여 생성한다.
    • Turbo : 부정 프롬프트가 별로 효과가 없다.
  • Diversity : Seed 값에 따른 다양성
    • Base : 구도, 얼굴, 조명등이 다양하게 바뀐다.
    • Turbo : 항상 비슷한 이미지를 생성
  • Visual Quality : 이미지 품질
    • Base : High 상당히 조건을 잘 적용하여 생성하여야 한다.
    • Turbo : Very High 대충 돌려도 잘 나온다.
이런 비교 결과 보면 왜  Base 모델을 출시했지?  하는 의문점이 생긴다.

2. Z-Image-Base 모델 특징

  • Undistilled Foundation : 원본 그대로인 기본 모델이다.  압축도 없고 학습자료 그대로이며 프롬프트를 정교하게 입력하여야 한다. 
  • Aesthetic Versatility : 다양하게 실사 뿐 아니라 디지털 아트, 애니 등등 다양하게 효과가 좋다.
  • Enhanced Output Diversity : seed 값에 따라 다양하게 바뀌어서 생성이 된다.   만약 한개의 이미지에 여러인분들이 있다면 인불들 각각이 개성있게 만들어 진다.
  • Built for Development : training 이나 Lora 학습등 다양하게 발전시킬 수 있다.
  • Robust Negative Control: 부정 프롬프트를 정확하게 잘 반영한다.
이 특징과 Turbo 모델과의 비교를 통하여 판단해 보면 Base 모델은 초보자 에게는 선택이 좋은 모델이 아니며 오히려 Turbo 모델을 추천하며,  중급 이상의 크리에이터들은 cfg, 긍정 과 부정 프롬프트를 잘 조절하여 원하는 결과를 만들어 낼 수 있을것으로 보이기 때문에 중급자 이상들에게 추천할 모델이다.

3. Z-Image-Base 모델 사용법 : comfyui 에서 사용

    Comfyui 를 업데이트 하면 Workflow Templates 에 이 모델을 사용 할 수있는 Workflow 가 있다.  그것을 불러들이면 거기에 모델, text encoder, vae 를 다운받을 수 있다.  comfyui/models 폴더의 하위 폴더들에 설치하여 사용하면 된다.

4. Z-Image-Base 로 생성된 이미지들


  • prompt : A mechanized soda can designed as an art piece, featuring intricate mechanical structures and a precise, high-tech aesthetic. The can is oversized, with an embossed mechanical Spider-Man head and spider body figure integrated into its surface. The concept blends packaging design and product photography, emphasizing the detailed mechanical can. The background is simple yet textured to enhance the product’s presence


  • Prompt : Photo-style, textured lighting, natural light, full of texture, photographic style. The image style is photo-style, photo-style, textured lighting, natural light, full of texture, photographic style. Adopting a photo-style, photo-style, textured lighting, natural light, full of texture, photographic style. Located in a golden villa over the sea. Huge, luxurious ceiling lights, mainly ice blue, a large spiral staircase adorned with various famous paintings, a huge leather sofa in the center of the room, next to an exquisite wine cabinet, leather cushions on the sofa, a huge, fluffy gray carpet on the floor, a metal coffee table in the center of the carpet with a metal vase and wine glasses containing wine. The entire house is predominantly luxurious, with flowers, romantic, and a sense of security. The image style is photo-style.

  • Prompt : masterpiece, best quality, ultra high res, 8k, unity 8k wallpaper, (photorealistic:1.4),1girl, solo, ancient chinese style, wuxia, (beautiful detailed face:1.2), detailed eyes, long black hair, hair ornament, (green and white hanfu:1.2), silk, translucent fabric, jewelry, (holding sword:1.3), sword, katana, weapon, (dynamic pose:1.2), (foreshorterning:1.3), hand reaching towards viewer, looking at viewer, intense gaze,falling petals, flower petals, wind, floating hair, motion blur,cinematic lighting, sunlight, backlight, ray tracing, tyndall effect,depth of field, bokeh, blurry background, traditional architecture background,warm natural sunlight streaming through traditional window, volumetric lighting, god rays, tyndall effect, floating dust motes dancing in the light, balanced exposure, detailed blurry garden background visible outside window, cinematic atmosphere, sharp focus on character


  • Prompt : A beautiful, elegant East Asian woman sitting barefoot on the floor, wearing a loose white button-down shirt and form-fitting blue jeans. She is holding a fine paintbrush in her right hand, poised to touch a palette of watercolors held in her left hand. Next to her is a white ceramic vase with a bouquet of realistic, pastel-colored flowers (roses, perhaps some greenery). The setting is a minimalist studio with a solid, neutral beige or light tan background, emphasizing soft, natural studio lighting. Highly detailed, photorealistic, cinematic light, 8k.


  • Prompt : A glamorous, ultra-realistic portrait of a stunningly beautiful young woman with long, wavy, honey blonde hair styled in soft, cascading curls, gently framing her face. She has striking green eyes, perfectly arched eyebrows, and subtly defined lips with a natural matte finish. She is wearing an elegant, form-fitting, champagne satin slip dress with thin spaghetti straps, a plunging V-neckline, and a high slit on the side, accentuating her curves. The dress is draped delicately over her body, catching soft, warm light to create subtle sheen and folds. She is posing confidently with one hand placed on her hip, her other leg raised and resting elegantly on a windowsill or soft surface, showing off her toned physique. She wears classic, large teardrop-shaped dangling earrings with a gold or champagne finish. The setting is a minimalist, bright, airy indoor space with soft natural light streaming in from a large window, creating gentle highlights and shadows on her skin and dress. The background is a clean, neutral off-white wall with sheer white curtains, adding depth and softness to the scene. The overall mood is sophisticated, sensual, and serene — a fashion editorial or luxury portrait style, with hyperrealistic skin texture and lighting, ultra-high detail, 8K, cinematic quality.



  • Prompt : Create a highly detailed and visually captivating image featuring the phrase "Happy New Year" rendered in elegant, three-dimensional ornate typography with flowing cursive flourishes and intricate internal vein-like patterns that evoke stained glass or iridescent gemstone textures. The letters should possess a metallic sheen with a gradient of warm rose gold, cool teal, and vibrant magenta hues that shift subtly under directional soft lighting, casting gentle, diffused shadows on a seamless purple surface to enhance depth and dimensionality. A delicate, luminous butterfly with iridescent wings displaying a spectrum of pastel blues, purples, and pinks should perch gracefully atop the letter , its wings catching the light with a pearlescent glow and fine translucency. the letter "2026" under , The overall aesthetic quality should be exceptionally high, with meticulous attention to surface texture, chromatic richness, and atmospheric lighting that creates a dreamlike, ethereal, and emotionally resonant composition.  






이 이미지는 모두 Z-Image-Base 모델로 생성 하였으며, 
Negative Prompt 는 low quality, worst quality, low resolution, blurry, out of focus, jpeg artifacts, overexposed, underexposed, flat lighting, harsh shadows, bad anatomy, bad proportions, deformed body, distorted face, bad hands, extra fingers, missing fingers, fused fingers, long neck, short neck, asymmetrical eyes, cross-eye, duplicate face, cloned face, same face syndrome, cropped head, cut off limbs, floating limbs, plastic skin, waxy skin, oversharpened, overprocessed, unnatural pose, stiff pose, text, watermark, logo, signature

를 사용하였다.

5. Z-Image-Base 모델 사용후 결론

    Z-Image-Base 모델도 이미지의 품질은 Turbo 와 비교해서 차이가 없다. 
다만 걸리는 시간은 Turbo 대비 3배 이상이 필요하다.  Base 모델은 최대한 프롬프트에 맞게 생성할려고 한다.  그래서 어떤 경우에 이미지로 만들기 어려운 프롬프트를 입력하면 이미지가 왜곡되어 이상하게 생성된다.  반대로 Turbo 모델은 대략 모델이 자체적으로 판단하여 다른 그럴싸한 이미지로 만드는 경우가 많다.  그래서 이 모델은 Lora, controlnet 모델이 훈련되어 나온다면 세밀한 지시로 원하는 이미지를 생성하기에 적합한 모델이라고 생각한다.
저 성능의 로컬컴퓨터라면 추천할 만한 모델이다.

그렇치만 개인적인 생각으로는 오픈소스 모델 중 Flux2 -> Qwen-Image 가 더 품질도 좋고 원하는 이미지를 잘 만들지 않을까 생각한다. 













댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...