기본 콘텐츠로 건너뛰기

QWEN 무료 이미지 생성 AI - Text to Image (Comfyui)

 QWEN은 알리바바의 AI 연구팀에서 개발한 대규모 언어 모델(LLM) 시리즈이다. 

QWEN 이미지 모델은 이미지 내부에 중국어와 영어 텍스트를 매우 정확하게 표현하는 데 특화되어 있다. 기존의 많은 이미지 생성 AI들이 텍스트를 제대로 구현하지 못하고 깨진 글자를 만들었던 한계를 극복했다. 이 모델은 텍스트의 위치, 서식, 의미를 정교하게 이해하여 실제 포스터나 배너 같은 이미지에 텍스트를 자연스럽게 통합할 수 있다.  물론 한글은 어렵지만 그래도 간단한 단어가 만들어 진다.  참 대단한 일이면서 ,  우리는 이런 AI 모델이 없는 것이 안타까운 일이다.

QWEN 으로 만든 이미지
"사랑해" 라는 단어를 표시해 준다.   

 
한자, 영어, 한글을 혼합하여 생성된 이미지
영어는 물론 한자도 매우 잘 표현한다.  중국의 알리바바 에서 출시한 모델이기 때문에 중국 한자 표현이 자연스럽고, 한글은 부족하지만 어렵게 표현 해 준다.

1. 모델 다운로드 및 workflow

    QWEN 모델을 이용하기 위하여 다음 3가지 모델을 다운 받아야 한다.
  • diffusion model : qwen_image_fp8_e4m3fn.safetensors (18G)
  • Text Encoder (CLIP) : qwen_2.5_vl_7b_fp8_scaled.safetensors
  • VAE : qwen_image_vae.safetensors
이 3가지 모델들을 다운받아 설치하면 된다.
구글을 검색하여 다운 받아도 되지만 먼저 Comfyui 를 최신 버전으로 업데이트를 한 후  QWEN Workflow 를 불러오면 Workflow 에 3가지 모델을 쉽게 다운받을 수 있는 Link 가 되어 있다.
Comfyui 의 Workflow -> Browse Templates 에 있는 Workflow


Workflow 내에 모델을 다운 받을 수 있는 Link

2. 이미지 생성

    이미지 생성은 steps : 20, cfg : 3.5 로 4070ti  16G 그래픽카드에서 생성 했을때 105초 ~ 150초 정도 소요한다.   

  • Prompt : A beautiful, photo-realistic portrait of a 20-year-old Korean K-pop woman with light skin, brown hair, and detailed blue eyes. She has a pretty face and a perfect, athletic body with medium breasts. She is wearing a white button-up shirt with "julian rad" and "tiemye" printed on it, a green skirt, and black stockings. An orange lanyard is around her neck, and a black watch is on her wrist. She has glasses on and is looking directly at the viewer with a neutral expression. She is sitting in a relaxed pose with her legs crossed, against a dark blue background. The lighting is soft and warm, casting gentle shadows. She is an office lady, and the image also shows an ID card, a pantyshot, and black panties.  gradient, spot color
프롬프트 대로 비교적 잘 표현한다.
글씨 표현력이 매우 뛰어난 모델이다.

  • Prompt : pyrography artwork, stunning beautiful korean lady in a brown wooden frame, minimalist background with flower symbols, intricate detailed knitted green halter neck mesh dress, form-fitting to mid-thigh, realistic artistic shading and lines, serene and timeless aesthetic.

나무 프레임에 사진

  • Prompt : This image is a stylized representation merging feminine allure with romantic elements. The composition features a woman's face rendered in delicate black line art, with a vibrant red rose positioned above her hair, symbolizing love and beauty. text "Love me tender, love me sweet, Never let me go. You have made my life complete, And I love you so." in heart, side view,An intricate arrangement of swirling vines adds a touch of fluidity. In the foreground, a red heart , embellished with a bow, contribute depth, while a subtle starry texture on the heart evokes a magical quality. The visual style draws inspiration from modern graphic design, combining elegance with minimalist aesthetics.
긴 문장의 text 인데 거의 표현을 잘 해준다.
엘비스프레슬리의  "Love me tendrer" 가사의 일부분 인데 ,
 Text 만큼은 어떤 이미지 생성형 AI 보다 뛰어난 능력이 있다고 본다.

  • Prompt : A mesmerizing work of art featuring a water droplet-shaped design that captures the purity and tranquility of nature.Inside the transparent droplet is a refined black-and-white silhouette of an elegant woman. Her long hair flows gently in the wind, and her half-body figure is formed with smooth, graceful curves, emphasizing elegance and fluidity.Intertwined with her silhouette are natural botanical elements—ivy, delicate leaves, and red flowers—symbolizing harmony between humanity and nature. The flowing lines and organic shapes create a natural rhythm throughout the composition.The bold contrast between the black silhouette and white background makes the design minimalistic yet sophisticated, while the droplet’s soft curves and subtle color blending add an ethereal, captivating quality.
물방울 내에 여성 실루엣
일반적인 이미지들은 모델에 따라 각각 호붛호가 있기 때문에 단정하기는 어렵지만,  이미지의 표현 능력은 다른 AI 들  Flux 나 stable diffusion , pony 등 과 비교해서 더 뛰어나다 고는 말하기 어렵다.


  • Prompt : A charming log cabin glows with warm, golden light, nestled among snow-covered pine trees. Smoke rises gently from the chimney into the crisp evening air. Tiny lanterns along the wooden porch cast a soft, inviting glow, while light snowflakes drift from the sky.  At the front door, a beautiful woman with long, wavy hair sits peacefully. She wears a cozy oversized sweater, leggings, and fluffy boots, holding a steaming cup of coffee with both hands. Her serene expression reflects the tranquil beauty of the snowy landscape. Behind her, frosted windows reveal a crackling fireplace and soft festive decorations. The background is painted with a dreamy winter sunset in soft pink and orange hues, enhancing the peaceful, magical atmosphere.

눈 덮인 산의 오두막
실사 이미지를 원했는데 애니 형식의 이미지가 생성 되었다.
그래도 나름 만족할 수준의 이미지 이다.

  • Prompt : animation style, animation character,A stunning woman with long, wavy, chestnut-brown hair sitting elegantly on a marble staircase.detailed eyes, perfect eyes, ((deep violet eyes:1.4)), She wears a short, white, sleeveless dress with intricate floral lace embroidery, designed with a slit that subtly reveals her leg, exuding sophistication and allure. Her pose is confident and poised, with one leg bent close to her chest and the other elegantly extended downward, showcasing the graceful curves of her figure. Her arms rest lightly on her raised knee, adding to her natural and captivating demeanor. She wears gold high-heeled shoes with delicate ankle straps, perfectly complementing her outfit. The background features classic architectural elements, such as stone columns and steps, enhancing the timeless elegance of the scene. Soft, natural lighting bathes her in a warm glow, accentuating her flawless skin and delicate facial features.
대리석 계단에 앉아 있는 여성
애니메이션 스타일로 잘 만들어 주었다.  디즈니 필름에 나오는 캐릭터 느낌이다.

  • Prompt : This enchanting silhouette scene features three characters against a softly illuminated background. The foreground includes a young girl and a woman, both intricately detailed, engaging with a whimsical creature. The environment is accentuated by an array of slender, bare trees, adding depth and framing the interaction. Warm, golden lighting contrasts against the dark silhouettes, enhancing the magical atmosphere. The composition is balanced with the characters placed dynamically within a winding path that draws the viewer's eye toward them, creating intrigue and a fairy-tale essence. The overall style pays homage to classic storybook illustrations, merging whimsy and artistic shadow play.

벽에 비치는 그림자 놀이

벽에 비치는 그림자놀이 이미지를 생성한 것 이다.  prompt 에 지시한 대로 잘 만들어 주었다.

  • Prompt : Graphite sketch of a beautiful woman, animation style, flat composition, face upward, sitting and cross legs, glossy ruby red lips. small breasts, She wears a elegant sheer white dress. the midi dress are designed with a sophisticated and artistic floral motif, prominently showcasing large roses and delicate vine patterns in shades of deep pink and purple.  sheer sleeves and a body-hugging silhouette. It is adorned with intricate, sparkling embellishments and features an artistic arrangement of flowers cascading down one side. The background features Luxury hotel lounge – A grand setting with high ceilings, polished marble floors, and an opulent chandelier illuminating the space. Elegant furniture and large windows reveal a breathtaking cityscape, enhancing the sophisticated ambiance. ((clean edges:1.4)),
거실에 앉아 있는 아름다운 여성
이것도 애니캐릭터 스타일로 만든 것 이다.  색감이나 구도나 포즈 모두 잘 만들어 졌다.

3. QWEN 에 대한 결론

  •     뛰어난 텍스트 표현을 한다.  영어 뿐만 아니라 중국어 한자도 표현을 잘하며,  한글도 어렵게 표현이 가능하다.  
  • 특히 장문의 텍스트도 잘 구현해 준다.
  • 실사풍, 일러스트, 수묵화 등 여러 가지 예술 스타일의 이미지를 생성할 수 있다.
  • Qwen-Image는 오픈소스로 공개되어 있어 누구나 자유롭게 모델을 활용하고 연구할 수 있다는 장점이 있다.
 이 모델은 용도에 맞추어 사용하면 좋을 듯 하다.

페인트 스플래쉬 이미지



여자 테니스 선수

폭염에는 견디어 내는 것 자체가 대단한 일 입니다.   좀 더 빨리 더위가 물러가기를 기원 합니다.


댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...