기본 콘텐츠로 건너뛰기

8월, 2025의 게시물 표시

Wan2.2 gguf Text to Image - Comfyui 에 의한 고화질 이미지 생성

 Wan2.2 모델은 알리바바(Alibaba)에서 개발한 오픈소스 AI 비디오 생성 모델이며,  기존 Wan2.1 보다 더 사실적이고 높은 품질의 영상을 만들 수 있다는 점이 가장 큰 특징이다. 주로 text to video 또는 image to video 를 제작하는데 사용되나 Wan2.1 text to video 모델을 이용하여 text to image 를 생성해 보면  Flux1-dev 모델보다 더 높은 품질과 사실적인 이미지를 얻을 수 있다.  물론 모델이 크기 때문에 생성시간이 조금 더 많이 소요되지만,  gguf 모델을 이용하면 그래도 1분30초 정도에 생성 할 수 있다.  (4070t vram 16G 환경하에서)  gguf 모델은 작은 vram 과 적은 스텝으로도 비슷한 품질의 이미지를 얻을 수 있기 때문에 많이 사용하는 모델이다. Wan2.2 모델을 이용하여 생성된 이미지 이미지는 1536x1536 으로 생성된 고품질의 이미지 이다.  확대해 보면 생생한 질감을 느낄 수 있다. 1.  Wan2.2-t2v 및 관련 모델 다운로드 wan2.2_t2v_high_noise_14B_Q5_K_S.gguf 와 wan2.2_t2v_low_noise_14B_Q5_K_S.gguf  : https://huggingface.co/bullerwins/Wan2.2-T2V-A14B-GGUF/tree/main 에서 다운 받거나  구글에서 검색해도 다운 받을 곳을 찾을 수 있다.  Q2 -> Q8 으로 갈수록 파일크기가 커지며 좀 더 좋은 품질의 이미지를 얻을 수 있지만 Q4 이상이면 보통 품질의 차이를 별로 느끼기 어렵기 때문에 여기서는 Q5 모델을 사용 하였다. CLIP Model  umt5-xxl-encoder-Q5_K_S : https://huggingface.co/city96/umt5-xxl-encoder-gguf/tree...

AI 가 추천한 가을에 어울리는 여성패션 색상 조합 - Flux in Comfyui

가을에 어울리는 여성의 패션 색상을 2가지 또는 3가지 정도로 배합하여 몇가지 알려줘. 라고 질문했을때  어울리는 가을 색상 조합 6가지이다. AI 가 무슨 감성이 있을까 하는 의구심이 있지만  그래도 추천해 준 색상조합을 이용하여 이미지를 만들어 보면 대부분 가을에 잘 어울리는 패션이 만들어 진다. 가을엔 톤 다운된 웜컬러(따뜻한 색) + 뉴트럴 컬러(검정, 베이지, 그레이) 조합이 안전하다. 이제 6가지를 직접 이미지 만들어 보고 느껴보자. 1. 브라운 + 베이지 + 올리브그린 부드러운 베이지 코트, 올리브그린 니트, 브라운 부츠 자연 친화적이고 고급스러운 가을 무드 Prompt : A beautiful Korean woman wearing a beige wool coat, an olive green knit sweater, and brown leather ankle boots, walking gracefully along a tree-lined boulevard filled with golden autumn leaves, shot from a low-angle with a 50mm prime lens, shallow depth of field, warm cinematic backlight filtering through the trees, ultra-realistic fabric textures, gentle breeze moving her hair, bokeh background. 배이지 코트 + 올리브그린 니트 + 브라운 부츠 노란 은행나무 와 잘 어울리는 가을 패션이라고 생각한다. 2. 버건디 + 카멜 버건디 니트 + 카멜색 트렌치코트 깊고 세련된 와인톤이 포인트 Prompt : A beautiful Korean woman in a burgundy turtleneck sweater and a camel-colored trench coat, standing elegantly on an old ston...

QWEN 무료 이미지 생성 AI - Text to Image (Comfyui)

 QWEN은 알리바바의 AI 연구팀에서 개발한 대규모 언어 모델(LLM) 시리즈이다.  QWEN 이미지 모델은 이미지 내부에 중국어와 영어 텍스트 를 매우 정확하게 표현하는 데 특화되어 있다. 기존의 많은 이미지 생성 AI들이 텍스트를 제대로 구현하지 못하고 깨진 글자를 만들었던 한계를 극복했다. 이 모델은 텍스트의 위치, 서식, 의미를 정교하게 이해하여 실제 포스터나 배너 같은 이미지에 텍스트를 자연스럽게 통합할 수 있다.  물론 한글은 어렵지만 그래도 간단한 단어가 만들어 진다.  참 대단한 일이면서 ,  우리는 이런 AI 모델이 없는 것이 안타까운 일이다. QWEN 으로 만든 이미지 "사랑해" 라는 단어를 표시해 준다.      한자, 영어, 한글을 혼합하여 생성된 이미지 영어는 물론 한자도 매우 잘 표현한다.  중국의 알리바바 에서 출시한 모델이기 때문에 중국 한자 표현이 자연스럽고, 한글은 부족하지만 어렵게 표현 해 준다. 1. 모델 다운로드 및 workflow     QWEN 모델을 이용하기 위하여 다음 3가지 모델을 다운 받아야 한다. diffusion model : qwen_image_fp8_e4m3fn.safetensors (18G) Text Encoder (CLIP) : qwen_2.5_vl_7b_fp8_scaled.safetensors VAE : qwen_image_vae.safetensors 이 3가지 모델들을 다운받아 설치하면 된다. 구글을 검색하여 다운 받아도 되지만 먼저 Comfyui 를 최신 버전으로 업데이트를 한 후  QWEN Workflow 를 불러오면 Workflow 에 3가지 모델을 쉽게 다운받을 수 있는 Link 가 되어 있다. Comfyui 의 Workflow -> Browse Templates 에 있는 Workflow Workflow 내에 모델을 다운 받을 수 있는 Link 2. 이미...

Wan2.1 Text to Image - Wan2.1 을 이용한 이미지 생성 (Comfyui)

Wan 2.1 은 텍스트나 이미지를 입력하면 고품질의 영상을 만들어주는 AI 비디오 생성 모델입니다.   지금은 Wan2.2 모델이 출시되었다.   보통 Wan2.1 은 Video 를 생성할 수있는 오픈소스 모델로 Comfyui 에서 Wan2.1 또는 Wan2.2 를 통하여 Text 나 Image 를 가지고 쉽게 Video 를 생성할 수 있는데, 여기서는 Wan2.1 모델을 이용하여 Text to Image 를 생성해 볼 려고 한다. Wan2.1 모델을 이용하여 이미지를 생성해 보면, 상당히  품질이 뛰어나며 생생한 사실적인 이미지를 만들어준다.   다만  모델의 크기가 커서 이미지 생성 속도가 느린 단점이 있다. Wan2.1 로 만든 이미지 위의 이미지를 보면  상당히 고품질 이미지로 얼굴의 솜털마저 자연스럽게 보이며, 좀 더 사실적인 사진 느낌을 나타내 준다. 1. Wan2.1 을 사용하기 위한 필요 모델들 다운로드 wan2.1_t2v_14B_fp8_scaled : 여기서는 이 모델을 사용하여 이미지를 만들어 본다.  이 모델의 다운 로드는  Hugging Face  에 있기 때문에 구글에서 검색하여   Hugging Face  에 서 다운 받아 기존의 Flux 모델 설치된 폴더에 설치하면 된다. CLIP 모델 :  umt5_xxl_fp8_e4m3fn_scaled.safetensors  이것을 다운 받아 설치하여 사용한다.  다운 받을 곳은 ( https://comfyanonymous.github.io/ComfyUI_examples/wan/  ) 에 들어가면 다운 받을 수 있다. VAE :  wan_2.1_vae.safetensors  이 모델을 다운받아 사용해야 한다. Lora 모델 : Wan2.1_T2V_14B_FusionX_LoRA 와 Wan21_T2...

Flux-krea-dev 이미지 생성 모델 - Flux-dev 모델과 차이

Flux1-krea-dev는 Black Forest Labs와 Krea AI가 협력하여 개발한 최신 오픈소스 텍스트-이미지 생성 AI 모델이다.   이 모델은 기존 AI 이미지에서 흔히 발견되는 부자연스러운 인공미를 제거하고, 뛰어난 사실감과 미적 품질을 제공하는 것을 목표로 만들어 졌다. Flux1-dev 모델로 이미지를 생성해 보면 매우 뛰어난 화질에 매료된다.  하지만 인물의 피부 질감이나 이미지의 색감이 인공미가 많이 느껴지는 것도 사실이다. 그래서 이러한 인공미를 최대한 자연스러운 사실감으로 생성될 수 있는 모델이 Flux1-krea-dev 이다. Flux1-krea-dev 모델로 생성 Flux1-dev 모델 이미지 사용된 Prompt : Graphite sketch of a beautiful woman, animation style, flat composition, face upward, ((happy smile:1.4)), sitting , cross legs, glossy ruby red lips. She wears an elegant sheer white midi dress designed with a sophisticated and artistic floral motif, prominently showcasing large roses and delicate vine patterns in shades of deep pink and purple. The dress features sheer sleeves, a body-hugging silhouette, and intricate, sparkling embellishments with an artistic arrangement of flowers cascading down one side. The background sets an elegant and atmospheric scene: Vintage-style classic café – Warm, ambient lightin...