기본 콘텐츠로 건너뛰기

QWEN-Image-Edit-2509 - 놀라운 이미지 편집 모델

Qwen-Image-Edit-2509 는 Alibaba Cloud의 인공지능 연구팀이 개발한 이미지 편집 모델인 'Qwen-Image-Edit'의 2025년 9월 업데이트 버전이다. 

Qwen-image-edit 은 그 뛰어난 편집능력으로 다양한 곳에서 적용해 사용할 수 있는 모델인데 업데이트 버전에서 변경된 점에 대하여 알아보고 실제 사용하여 이미지를 생성해 보도록 한다.
QWEN-Edit-2509


1. 주요 개선 사항 및 주요 특징

  • 다중이미지 편집 지원 : 최대 3개의 이미지를 입력하여 병합하거나 편집할 수 있게 한다.  물론 기존에도 변칙적으로 3가지 이미지를 입력하여 편집이 가능 하였지만 정확도가 많이 떨어졌는데 이제는 상당히 원하는 요구조건을 충족시켜준다.
  • 향상된 일관성 유지 : 인물이나 제품 등 많은 내용들을 훨씬 더 똑같이 일관성을 유지해 준다.
  • Controlnet 기능이 가능하다 : 특히 오픈포즈 기능을 이용하여 똑같은 포즈의 인물을 만들수 있다.

2. 필요한 모델 다운로드 및 설치

  • Diffusion Model :
    • Qwen-Image-Edit-2509-gguf : https://huggingface.co/QuantStack/Qwen-Image-Edit-2509-GGUF/tree/main 
    • 가급적 그래픽카드의 성능 때문에 gguf 모델을 사용하여 편집을 한다. 
  • lora : 
    • Qwen-Image-Lightning-4steps-V2.0 : https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main 
  • Text Encoder :
    • qwen_2.5_vl_7b_fp8_scaled : https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders?utm_source=chatgpt.com 
  • VAE :
    • qwen_image_vae : https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/blob/main/split_files/vae/qwen_image_vae.safetensors?utm_source=chatgpt.com 

위에 있는 모델들은 링크가 잘 안되면 구글을 검색하여 다운 받으면 된다.

3. Workflow

3가지 이미지 사용 workflow
이 이미지를 다운하여 Comfyui 에 드롭하면 workflow 를 그대로 사용할 수 있다.

4. 하나의 이미지 편집

workflow 에서 첫번째 이미지를 제외한 나머지는 pass 시킨후 이미지 편집작업을 하면 된다.
원본이미지
프롬프트 : 아름다운 여성이 돌아서서 등을 보이고 요리를 만들고 있다.  의상 그리고 배경은 그대로 유지 합니다. 

편집된 이미지
프롬프트는 굳이 영어로 작성 할 필요가 없이 한글로 작성 하여도 인식을 잘 한다.
결과를 보면 요구 조건에 맞게 매우 잘 생성해 준다.

원본이미지
프롬프트 : 아름다운 여성이 주방에서 서서 커피를 한잔 마시고 있다. 얼굴, 의상 그대로 유지 합니다. 

편집된 이미지
얼굴도 거의 변하지 않고, 옷 차림도 확장하여 그대로 인듯 잘 표현하여 만들어준다.

5. 두개의 이미지를 이용한 편집

 위의 여성 얼굴 이미지 + 콜라캔 사진을 이용하여 편집해 본다.
원본 이미지2 : 콜라 캔 사진

  • 프롬프트 : 아름다운 여성이 주방에서 서서 사진 속 PEPSI 콜라 캔을 들고 마시고 있다. 얼굴, 의상 그대로 유지 합니다. 

2개의 이미지로 편집된 결과
콜라캔도 정확하게 병합하여 만들어 주었다.

6. 3개의 이미지를 이용한 편집

여성이미지 + 콜라캔 + 오픈포즈 사진을 이용하여 만들어 보자.

원본이미지 3 : 오픈포즈 용

설현 씨의 멋진 포즈를 한번 이용해 볼려고 합니다.

  • 프롬프트 : 아름다운 여성이 주방에서 서서 사진 속 PEPSI 콜라 캔을 들고 포즈를 취하고 있다. 미소를 짓고 있는얼굴, 의상 그대로 유지 합니다. 

편집된 결과물
이정도로 잘 만들면 이제 광고에도 실 적용하는데 문제가 없다는 생각입니다.
다른 오픈포즈 일때
이런 포즈로 바꾸어서 다시 만들어 봅니다.

다른 포즈적용 결과

이것 참..... 굳이 광고모델이 필요할까 하는 생각이 문득 듭니다.

원본 이미지 2 : 의상
의상과 이미지3 다른 포즈의 사진을 입력했을 때

  • 프롬프트 : 아름다운 여성이 거리에서 사진 속  원피스를 입고 포즈를 취하고 있다. 미소를 짓고 있는얼굴, 

편집 결과 이미지

의상도 생각보다 훨씬 더 비슷한 의상으로 이미지를 만들어 준다.


 7. 결론

요약하자면, 'Qwen-Image-Edit-2509'는 단순히 단일 이미지를 수정하는 것을 넘어, 여러 이미지를 결합하고, 편집된 결과의 인물, 제품, 텍스트 일관성을 강력하게 유지하며, ControlNet을 통한 정밀한 구조 제어까지 가능하게 함으로써 실제 크리에이티브 및 전문 작업 환경에서 활용될 수 있는 실용적인 이미지 편집 도구라고 생각합니다.

점점 이미지 생성 및 편집 AI 가 발전함에 따라  훨씬 더 많은 분야에서 유용하게 사용할 수 있습니다.











   

댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...

이미지에서 프롬프트 추출하기 in Comfyui - QWEN3-VL

 이미지 또는 사진에서 Prompt(프롬프트)를 추출하여 사용하기 네이버, 구글 또는 핀터레스트 등의 사이트에서 마음에 드는 사진을 보고 비슷한 이미지를 만들고 싶을때,   그 사진을 보고 직접 그것을 프롬프트로 만들기가 어려운 일이다.  만들었다고 해도 그것을 이용하여 이미지를 생성해 보면 원하는 이미지와는 동 떨어진 이미지가 만들어지기 쉽다. 그래서 보통은 chatGPT 나 GEMINI 를 이용하여 이미지를 업로드하고 프롬프트를 만들어 달라고 하여 추출한다.  나도 이런 방식으로 종종 프롬프트를 추출하여 사용하곤 한다. 여기에서는 외부 도움을 받아 추출하는 대신  내 컴퓨터에서 추출하여 사용하는 방법이다. 1. 이미지에서 프롬프트 추출 예 Z-Image-Turbo 로 만든 이미지 위의 이미지에서 프롬프트를 추출 한다면...... chatGPT : A soft, elegant portrait of a young woman sitting on the floor, painting flowers with a brush and a palette. She wears a crisp white shirt with rolled-up sleeves and fitted blue jeans. Her long dark hair flows naturally as she focuses calmly on her artwork. A vase filled with colorful roses stands beside her. The scene has a warm beige background, smooth lighting, clean details, and a serene, gentle atmosphere. Ultra-high-definition, photorealistic illustration, soft shadows, pastel tones, refined skin texture, delicate rendering. G...