QWEN-Image-Edit-2509 - 놀라운 이미지 편집 모델

Qwen-Image-Edit-2509 는 Alibaba Cloud의 인공지능 연구팀이 개발한 이미지 편집 모델인 'Qwen-Image-Edit'의 2025년 9월 업데이트 버전이다.

Qwen-image-edit 은 그 뛰어난 편집능력으로 다양한 곳에서 적용해 사용할 수 있는 모델인데 업데이트 버전에서 변경된 점에 대하여 알아보고 실제 사용하여 이미지를 생성해 보도록 한다.

QWEN-Edit-2509

1. 주요 개선 사항 및 주요 특징

다중이미지 편집 지원 : 최대 3개의 이미지를 입력하여 병합하거나 편집할 수 있게 한다. 물론 기존에도 변칙적으로 3가지 이미지를 입력하여 편집이 가능 하였지만 정확도가 많이 떨어졌는데 이제는 상당히 원하는 요구조건을 충족시켜준다.
향상된 일관성 유지 : 인물이나 제품 등 많은 내용들을 훨씬 더 똑같이 일관성을 유지해 준다.
Controlnet 기능이 가능하다 : 특히 오픈포즈 기능을 이용하여 똑같은 포즈의 인물을 만들수 있다.

2. 필요한 모델 다운로드 및 설치

Diffusion Model :

Qwen-Image-Edit-2509-gguf : https://huggingface.co/QuantStack/Qwen-Image-Edit-2509-GGUF/tree/main
가급적 그래픽카드의 성능 때문에 gguf 모델을 사용하여 편집을 한다.

lora :

Qwen-Image-Lightning-4steps-V2.0 : https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main

Text Encoder :

qwen_2.5_vl_7b_fp8_scaled : https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders?utm_source=chatgpt.com

VAE :

qwen_image_vae : https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/blob/main/split_files/vae/qwen_image_vae.safetensors?utm_source=chatgpt.com

위에 있는 모델들은 링크가 잘 안되면 구글을 검색하여 다운 받으면 된다.

3. Workflow

3가지 이미지 사용 workflow

이 이미지를 다운하여 Comfyui 에 드롭하면 workflow 를 그대로 사용할 수 있다.

4. 하나의 이미지 편집

workflow 에서 첫번째 이미지를 제외한 나머지는 pass 시킨후 이미지 편집작업을 하면 된다.

원본이미지

프롬프트 : 아름다운 여성이 돌아서서 등을 보이고 요리를 만들고 있다. 의상 그리고 배경은 그대로 유지 합니다.

편집된 이미지

프롬프트는 굳이 영어로 작성 할 필요가 없이 한글로 작성 하여도 인식을 잘 한다.

결과를 보면 요구 조건에 맞게 매우 잘 생성해 준다.

원본이미지

프롬프트 : 아름다운 여성이 주방에서 서서 커피를 한잔 마시고 있다. 얼굴, 의상 그대로 유지 합니다.

편집된 이미지

얼굴도 거의 변하지 않고, 옷 차림도 확장하여 그대로 인듯 잘 표현하여 만들어준다.

5. 두개의 이미지를 이용한 편집

위의 여성 얼굴 이미지 + 콜라캔 사진을 이용하여 편집해 본다.

원본 이미지2 : 콜라 캔 사진

프롬프트 : 아름다운 여성이 주방에서 서서 사진 속 PEPSI 콜라 캔을 들고 마시고 있다. 얼굴, 의상 그대로 유지 합니다.

2개의 이미지로 편집된 결과

콜라캔도 정확하게 병합하여 만들어 주었다.

6. 3개의 이미지를 이용한 편집

여성이미지 + 콜라캔 + 오픈포즈 사진을 이용하여 만들어 보자.

원본이미지 3 : 오픈포즈 용

설현 씨의 멋진 포즈를 한번 이용해 볼려고 합니다.

프롬프트 : 아름다운 여성이 주방에서 서서 사진 속 PEPSI 콜라 캔을 들고 포즈를 취하고 있다. 미소를 짓고 있는얼굴, 의상 그대로 유지 합니다.

편집된 결과물

이정도로 잘 만들면 이제 광고에도 실 적용하는데 문제가 없다는 생각입니다.

다른 오픈포즈 일때

이런 포즈로 바꾸어서 다시 만들어 봅니다.

다른 포즈적용 결과

이것 참..... 굳이 광고모델이 필요할까 하는 생각이 문득 듭니다.

원본 이미지 2 : 의상

의상과 이미지3 다른 포즈의 사진을 입력했을 때

프롬프트 : 아름다운 여성이 거리에서 사진 속 원피스를 입고 포즈를 취하고 있다. 미소를 짓고 있는얼굴,

편집 결과 이미지

의상도 생각보다 훨씬 더 비슷한 의상으로 이미지를 만들어 준다.

7. 결론

요약하자면, 'Qwen-Image-Edit-2509'는 단순히 단일 이미지를 수정하는 것을 넘어, 여러 이미지를 결합하고, 편집된 결과의 인물, 제품, 텍스트 일관성을 강력하게 유지하며, ControlNet을 통한 정밀한 구조 제어까지 가능하게 함으로써 실제 크리에이티브 및 전문 작업 환경에서 활용될 수 있는 실용적인 이미지 편집 도구라고 생각합니다.

점점 이미지 생성 및 편집 AI 가 발전함에 따라 훨씬 더 많은 분야에서 유용하게 사용할 수 있습니다.

이 블로그 검색