QWEN은 알리바바의 AI 연구팀에서 개발한 대규모 언어 모델(LLM) 시리즈이다.
QWEN 이미지 모델은 이미지 내부에 중국어와 영어 텍스트를 매우 정확하게 표현하는 데 특화되어 있다. 기존의 많은 이미지 생성 AI들이 텍스트를 제대로 구현하지 못하고 깨진 글자를 만들었던 한계를 극복했다. 이 모델은 텍스트의 위치, 서식, 의미를 정교하게 이해하여 실제 포스터나 배너 같은 이미지에 텍스트를 자연스럽게 통합할 수 있다. 물론 한글은 어렵지만 그래도 간단한 단어가 만들어 진다. 참 대단한 일이면서 , 우리는 이런 AI 모델이 없는 것이 안타까운 일이다.
 |
QWEN 으로 만든 이미지 |
"사랑해" 라는 단어를 표시해 준다.
 |
한자, 영어, 한글을 혼합하여 생성된 이미지 |
영어는 물론 한자도 매우 잘 표현한다. 중국의 알리바바 에서 출시한 모델이기 때문에 중국 한자 표현이 자연스럽고, 한글은 부족하지만 어렵게 표현 해 준다.
1. 모델 다운로드 및 workflow
QWEN 모델을 이용하기 위하여 다음 3가지 모델을 다운 받아야 한다.
- diffusion model : qwen_image_fp8_e4m3fn.safetensors (18G)
- Text Encoder (CLIP) : qwen_2.5_vl_7b_fp8_scaled.safetensors
- VAE : qwen_image_vae.safetensors
이 3가지 모델들을 다운받아 설치하면 된다.
구글을 검색하여 다운 받아도 되지만 먼저 Comfyui 를 최신 버전으로 업데이트를 한 후 QWEN Workflow 를 불러오면 Workflow 에 3가지 모델을 쉽게 다운받을 수 있는 Link 가 되어 있다.
.png) |
Comfyui 의 Workflow -> Browse Templates 에 있는 Workflow |
 |
Workflow 내에 모델을 다운 받을 수 있는 Link |
2. 이미지 생성
이미지 생성은 steps : 20, cfg : 3.5 로 4070ti 16G 그래픽카드에서 생성 했을때 105초 ~ 150초 정도 소요한다.
- Prompt : A beautiful, photo-realistic portrait of a 20-year-old Korean K-pop woman with light skin, brown hair, and detailed blue eyes. She has a pretty face and a perfect, athletic body with medium breasts. She is wearing a white button-up shirt with "julian rad" and "tiemye" printed on it, a green skirt, and black stockings. An orange lanyard is around her neck, and a black watch is on her wrist. She has glasses on and is looking directly at the viewer with a neutral expression. She is sitting in a relaxed pose with her legs crossed, against a dark blue background. The lighting is soft and warm, casting gentle shadows. She is an office lady, and the image also shows an ID card, a pantyshot, and black panties. gradient, spot color
 |
프롬프트 대로 비교적 잘 표현한다. |
글씨 표현력이 매우 뛰어난 모델이다.
- Prompt : pyrography artwork, stunning beautiful korean lady in a brown wooden frame, minimalist background with flower symbols, intricate detailed knitted green halter neck mesh dress, form-fitting to mid-thigh, realistic artistic shading and lines, serene and timeless aesthetic.
 |
나무 프레임에 사진 |
- Prompt : This image is a stylized representation merging feminine allure with romantic elements. The composition features a woman's face rendered in delicate black line art, with a vibrant red rose positioned above her hair, symbolizing love and beauty. text "Love me tender, love me sweet, Never let me go. You have made my life complete, And I love you so." in heart, side view,An intricate arrangement of swirling vines adds a touch of fluidity. In the foreground, a red heart , embellished with a bow, contribute depth, while a subtle starry texture on the heart evokes a magical quality. The visual style draws inspiration from modern graphic design, combining elegance with minimalist aesthetics.
 |
긴 문장의 text 인데 거의 표현을 잘 해준다. |
엘비스프레슬리의 "Love me tendrer" 가사의 일부분 인데 ,
Text 만큼은 어떤 이미지 생성형 AI 보다 뛰어난 능력이 있다고 본다.
- Prompt : A mesmerizing work of art featuring a water droplet-shaped design that captures the purity and tranquility of nature.Inside the transparent droplet is a refined black-and-white silhouette of an elegant woman. Her long hair flows gently in the wind, and her half-body figure is formed with smooth, graceful curves, emphasizing elegance and fluidity.Intertwined with her silhouette are natural botanical elements—ivy, delicate leaves, and red flowers—symbolizing harmony between humanity and nature. The flowing lines and organic shapes create a natural rhythm throughout the composition.The bold contrast between the black silhouette and white background makes the design minimalistic yet sophisticated, while the droplet’s soft curves and subtle color blending add an ethereal, captivating quality.
 |
물방울 내에 여성 실루엣 |
일반적인 이미지들은 모델에 따라 각각 호붛호가 있기 때문에 단정하기는 어렵지만, 이미지의 표현 능력은 다른 AI 들 Flux 나 stable diffusion , pony 등 과 비교해서 더 뛰어나다 고는 말하기 어렵다.
- Prompt : A charming log cabin glows with warm, golden light, nestled among snow-covered pine trees. Smoke rises gently from the chimney into the crisp evening air. Tiny lanterns along the wooden porch cast a soft, inviting glow, while light snowflakes drift from the sky. At the front door, a beautiful woman with long, wavy hair sits peacefully. She wears a cozy oversized sweater, leggings, and fluffy boots, holding a steaming cup of coffee with both hands. Her serene expression reflects the tranquil beauty of the snowy landscape. Behind her, frosted windows reveal a crackling fireplace and soft festive decorations. The background is painted with a dreamy winter sunset in soft pink and orange hues, enhancing the peaceful, magical atmosphere.
 |
눈 덮인 산의 오두막 |
실사 이미지를 원했는데 애니 형식의 이미지가 생성 되었다.
그래도 나름 만족할 수준의 이미지 이다.
- Prompt : animation style, animation character,A stunning woman with long, wavy, chestnut-brown hair sitting elegantly on a marble staircase.detailed eyes, perfect eyes, ((deep violet eyes:1.4)), She wears a short, white, sleeveless dress with intricate floral lace embroidery, designed with a slit that subtly reveals her leg, exuding sophistication and allure. Her pose is confident and poised, with one leg bent close to her chest and the other elegantly extended downward, showcasing the graceful curves of her figure. Her arms rest lightly on her raised knee, adding to her natural and captivating demeanor. She wears gold high-heeled shoes with delicate ankle straps, perfectly complementing her outfit. The background features classic architectural elements, such as stone columns and steps, enhancing the timeless elegance of the scene. Soft, natural lighting bathes her in a warm glow, accentuating her flawless skin and delicate facial features.
 |
대리석 계단에 앉아 있는 여성 |
애니메이션 스타일로 잘 만들어 주었다. 디즈니 필름에 나오는 캐릭터 느낌이다.
- Prompt : This enchanting silhouette scene features three characters against a softly illuminated background. The foreground includes a young girl and a woman, both intricately detailed, engaging with a whimsical creature. The environment is accentuated by an array of slender, bare trees, adding depth and framing the interaction. Warm, golden lighting contrasts against the dark silhouettes, enhancing the magical atmosphere. The composition is balanced with the characters placed dynamically within a winding path that draws the viewer's eye toward them, creating intrigue and a fairy-tale essence. The overall style pays homage to classic storybook illustrations, merging whimsy and artistic shadow play.
 |
벽에 비치는 그림자 놀이 |
벽에 비치는 그림자놀이 이미지를 생성한 것 이다. prompt 에 지시한 대로 잘 만들어 주었다.
- Prompt : Graphite sketch of a beautiful woman, animation style, flat composition, face upward, sitting and cross legs, glossy ruby red lips. small breasts, She wears a elegant sheer white dress. the midi dress are designed with a sophisticated and artistic floral motif, prominently showcasing large roses and delicate vine patterns in shades of deep pink and purple. sheer sleeves and a body-hugging silhouette. It is adorned with intricate, sparkling embellishments and features an artistic arrangement of flowers cascading down one side. The background features Luxury hotel lounge – A grand setting with high ceilings, polished marble floors, and an opulent chandelier illuminating the space. Elegant furniture and large windows reveal a breathtaking cityscape, enhancing the sophisticated ambiance. ((clean edges:1.4)),
 |
거실에 앉아 있는 아름다운 여성 |
이것도 애니캐릭터 스타일로 만든 것 이다. 색감이나 구도나 포즈 모두 잘 만들어 졌다.
3. QWEN 에 대한 결론
- 뛰어난 텍스트 표현을 한다. 영어 뿐만 아니라 중국어 한자도 표현을 잘하며, 한글도 어렵게 표현이 가능하다.
- 특히 장문의 텍스트도 잘 구현해 준다.
- 실사풍, 일러스트, 수묵화 등 여러 가지 예술 스타일의 이미지를 생성할 수 있다.
- Qwen-Image는 오픈소스로 공개되어 있어 누구나 자유롭게 모델을 활용하고 연구할 수 있다는 장점이 있다.
이 모델은 용도에 맞추어 사용하면 좋을 듯 하다.
 |
페인트 스플래쉬 이미지 |
 |
여자 테니스 선수 |
폭염에는 견디어 내는 것 자체가 대단한 일 입니다. 좀 더 빨리 더위가 물러가기를 기원 합니다.
댓글
댓글 쓰기