막강한 이미지 편집 모델 - QWEN-Image-Edit-2511

이미지 편집하면 GEMINI 또는 chatGPT 를 이용하여 만족스러운 결과를 얻을 수 있다.

여기서는 로컬 컴퓨터에서 할 수 있는 막강한 이미지 편집 모델을 다시 소개 하고자 한다.

다시 소개한다는 의미는 이 모델은 새로운 편집 모델이 아니고 업그레이드된 모델이기 때문이다.

강력한 이미지 편집 모델 모델의 업그레이드 버전이 나왔다.

이다.

Qwen-Image-Edit-2511

인물 일관성 향상: 다양한 편집 중에서 인물의 정체성과 시각적 특징을 더욱 잘 유지 보존해 준다. 2509에서는 편집후 원본이미지에서 인물의 이미지가 변형되는 경우가 종종 있었는데 그런 현상이 현저히 줄었다. 거의 원본의 인물 이미지를 그대로 유지해 준다.
다인물 일관성 유지: 여러 인물 이미지를 고품질로 융합하여 일관성 있는 단체 사진 생성. 이것 역시 인물을 여러명 사용하여 편집할 때에도 역시 일관성을 잘 유지해 준다.
통합 LoRA 기능: 인기 있는 커뮤니티 LoRA 기능이 기본 모델에 직접 내장됨. 조명 최적화, 특정 화풍 등 사용자들이 자주 쓰는 인기 LoRA 기능을 모델 자체에 내장하여 추가 설정 없이도 고품질 결과물을 만들어 준다.
강화된 기하학적 추론 및 향상된 산업 디자인 생성: 제품 디자인이나 산업용 설계 시 비율과 원근감을 유지하며 수정하는 능력이 강화되었다.

Qwen-Image-Edit-2511 (BF16): 공식 원본 모델. 약 57.7GB의 대용량이며, 정밀한 편집이 필요한 서버급 환경에 적합. 고성능 그래픽 카드 필수.
Qwen-Image-Edit-2511-FP8: 메모리 사용량을 절반으로 줄이면서 성능 저하를 최소화한 버전입니다. RTX 3090/4090 등 소비자용 하이엔드 GPU에서 원활하게 구동 가능.
양자화 모델들 : Q4_K_M / Q5_K_M: 품질과 용량 사이의 최적의 균형을 제공. (약 12~16GB VRAM 권장), Q8_0: 원본에 가장 가까운 품질을 유지하는 고정밀 양자화 버전. 이 양자화 모델은 16GB 이하에서도 비교적 동작이 잘 된다.

필요한 diffusion model 들은 구글에서 검색하면 쉽게 다운로드 할 수 있다.
workflow 도 comfyui 를 최신 버전으로 업데이트후 실행하면 workflow template 에 qwen-image-edit-2511 용 모델을 사용할 workflow 가 있다.
빠른 실행을 위한 Lora 도 workflow에 링크가 있기 때문에 다운로드하여 사용한다.
Text Encoder 와 VAE 는 기존것을 그대로 사용하면 된다.

Prompt : The background features the Eiffel Tower in Paris, without any street and buildings behind it, and the characters blend naturally into the environment.
좌 : 입력이미지, 우: 편집 결과 이미지

prompt : Create a full body image of a fashion model posing . change cloths to a cloths of image 2. while maintaining the features of the person in the photo. ponytail hair
좌 1,2 : 얼굴과 의상 입력, 우: 결과 이미지
얼굴의 특징을 그대로 이용하고 , 의상도 입력된 의상과 거의 유사하게 만들어 준다.

prompt : input text "Wishing you a wonderful 2026, good health always, and a very Happy New Year!" in bottom of image
좌 : 원본, 우: 다중 text 편집
정확하게 영어를 표현해 준다.

물론 qwen-image-edit-2509 도 역시 이미지 편집에 막강한 기능을 보여 주었는데 , 2511 은 기능이 강화되어 좀 더 정확하고 고품질로 잘 만들어 준다. 다양한 전문 분야에서 이미지 편집에 사용해도 전혀 문제가 없다고 생각한다.