기본 콘텐츠로 건너뛰기

막강한 이미지 편집 모델 - QWEN-Image-Edit-2511

이미지 편집하면 GEMINI 또는 chatGPT 를 이용하여 만족스러운 결과를 얻을 수 있다.

여기서는 로컬 컴퓨터에서 할 수 있는 막강한 이미지 편집 모델을 다시 소개 하고자 한다.
다시 소개한다는 의미는 이 모델은 새로운 편집 모델이 아니고 업그레이드된 모델이기 때문이다.
강력한 이미지 편집 모델 Qwen-Image-Edit-2509 모델의 업그레이드 버전이 나왔다. 

Qwen-Image-Edit-2511


1. 2509 보다 더 개선된 기능

  • 인물 일관성 향상: 다양한 편집 중에서 인물의 정체성과 시각적 특징을 더욱 잘 유지 보존해 준다.  2509에서는 편집후 원본이미지에서 인물의 이미지가 변형되는 경우가 종종 있었는데 그런 현상이 현저히 줄었다.  거의 원본의 인물 이미지를 그대로 유지해 준다.
  • 다인물 일관성 유지: 여러 인물 이미지를 고품질로 융합하여 일관성 있는 단체 사진 생성.  이것 역시 인물을 여러명 사용하여 편집할 때에도 역시 일관성을 잘 유지해 준다.
  • 통합 LoRA 기능: 인기 있는 커뮤니티 LoRA 기능이 기본 모델에 직접 내장됨.   조명 최적화, 특정 화풍 등 사용자들이 자주 쓰는 인기 LoRA 기능을 모델 자체에 내장하여 추가 설정 없이도 고품질 결과물을 만들어 준다.
  • 강화된 기하학적 추론 및 향상된 산업 디자인 생성: 제품 디자인이나 산업용 설계 시 비율과 원근감을 유지하며 수정하는 능력이 강화되었다.

2. 공식 및 정밀도별 기본 모델

  • Qwen-Image-Edit-2511 (BF16): 공식 원본 모델. 약 57.7GB의 대용량이며, 정밀한 편집이 필요한 서버급 환경에 적합.  고성능 그래픽 카드 필수.

  • Qwen-Image-Edit-2511-FP8: 메모리 사용량을 절반으로 줄이면서 성능 저하를 최소화한 버전입니다. RTX 3090/4090 등 소비자용 하이엔드 GPU에서 원활하게 구동 가능.

  • 양자화 모델들 : Q4_K_M / Q5_K_M: 품질과 용량 사이의 최적의 균형을 제공. (약 12~16GB VRAM 권장),  Q8_0: 원본에 가장 가까운 품질을 유지하는 고정밀 양자화 버전. 이 양자화 모델은 16GB 이하에서도 비교적 동작이 잘 된다.


3. 모델 다운로드 및 workflow

  • 필요한 diffusion model 들은 구글에서 검색하면 쉽게 다운로드 할 수 있다.
  • workflow 도 comfyui 를 최신 버전으로 업데이트후 실행하면 workflow template 에 qwen-image-edit-2511 용 모델을 사용할 workflow 가 있다.
  • 빠른 실행을 위한 Lora 도 workflow에 링크가 있기 때문에 다운로드하여 사용한다.
  • Text Encoder 와 VAE 는 기존것을 그대로 사용하면 된다.

4. 사용 실례

  • 배경 변경
    • Prompt : The background features the Eiffel Tower in Paris, without any street and buildings behind it, and the characters blend naturally into the environment.

    • 좌 : 입력이미지, 우: 편집 결과 이미지

  • 머리, 의상변경
    • prompt : Create a full body image of a fashion model posing  . change cloths to a cloths of image 2.  while maintaining the features of the person in the photo. ponytail hair


    • 좌 1,2 : 얼굴과 의상 입력, 우: 결과 이미지
      얼굴의 특징을 그대로 이용하고 , 의상도 입력된 의상과 거의 유사하게 만들어 준다.
  • 인물 180도 회전
    • prompt : Rotate the character's camera angle 180 degrees . maintain  same pose.

    • 좌 : 원본, 우: 180도 회전 이미지
      너무 잘 만들어 줘서 마치 photoshop 을 이용하여 편집한 느낌이다.
  • 자동차 차체 재질 변경
    • prompt : Change the car body to the wood grain pattern of the image 2.

    • 좌: 자동차와 나무이미지 입력, 우 : 결과 이미지
      자동차 차체가 자연스럽게 나무로 변경되었다.
  • 거실 조명 효과
    • prompt 1 : Image of morning sunlight shining through a window
    • prompt 2 : mage of a living room on a dark night. There's only dim light.

    • 좌: 원본이미지, 중: prompt 1 이미지, 우: prompt 2 이미지
      원본 이미지의 변형없이 조명들만 자연스럽게 바뀌었다.
  • 다중 Text 
    • prompt : input text "Wishing you a wonderful 2026, good health always, and a very Happy New Year!" in bottom of image 

    • 좌 : 원본, 우: 다중 text 편집
      정확하게 영어를 표현해 준다.

5. qwen-image-edit-2511 테스트 결과

    물론 qwen-image-edit-2509 도 역시 이미지 편집에 막강한 기능을 보여 주었는데 , 2511 은 기능이 강화되어  좀 더 정확하고 고품질로 잘 만들어 준다.  다양한 전문 분야에서 이미지 편집에 사용해도 전혀 문제가 없다고 생각한다. 


댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...

이미지에서 프롬프트 추출하기 in Comfyui - QWEN3-VL

 이미지 또는 사진에서 Prompt(프롬프트)를 추출하여 사용하기 네이버, 구글 또는 핀터레스트 등의 사이트에서 마음에 드는 사진을 보고 비슷한 이미지를 만들고 싶을때,   그 사진을 보고 직접 그것을 프롬프트로 만들기가 어려운 일이다.  만들었다고 해도 그것을 이용하여 이미지를 생성해 보면 원하는 이미지와는 동 떨어진 이미지가 만들어지기 쉽다. 그래서 보통은 chatGPT 나 GEMINI 를 이용하여 이미지를 업로드하고 프롬프트를 만들어 달라고 하여 추출한다.  나도 이런 방식으로 종종 프롬프트를 추출하여 사용하곤 한다. 여기에서는 외부 도움을 받아 추출하는 대신  내 컴퓨터에서 추출하여 사용하는 방법이다. 1. 이미지에서 프롬프트 추출 예 Z-Image-Turbo 로 만든 이미지 위의 이미지에서 프롬프트를 추출 한다면...... chatGPT : A soft, elegant portrait of a young woman sitting on the floor, painting flowers with a brush and a palette. She wears a crisp white shirt with rolled-up sleeves and fitted blue jeans. Her long dark hair flows naturally as she focuses calmly on her artwork. A vase filled with colorful roses stands beside her. The scene has a warm beige background, smooth lighting, clean details, and a serene, gentle atmosphere. Ultra-high-definition, photorealistic illustration, soft shadows, pastel tones, refined skin texture, delicate rendering. G...