FireRed-Image-edit이란?
FireRed-Image-edit은 텍스트 기반의 지시어(Instruction)를 통해 이미지를 편집하는 최신 LMM(Large Multimodal Model) 기반 편집 모델이다. 기존 모델들이 복잡한 편집 명령을 수행할 때 이미지의 엉뚱한 부분을 바꾸거나 화질을 저하시키는 문제를 해결하기 위해 등장했다.
개인적으로 오픈소스 중에서 이미지 편집모델은 Qwen-Image-Edit-2511 이 가장 좋았다.
그런데 이번에 출시된 FireRed-Image-Edit-1.0 버전도 상당히 마음에 드는 이미지 편집모델이다.
![]() |
| FireRed-Image-Edit-1.0 |
1. 주요 특징
- 정교한 지시어 이해: "배경의 사과를 오렌지로 바꿔줘"와 같은 구체적인 자연어 명령어를 정확히 수행한다.
- 내용 보존 (Content Preservation): 수정이 필요 없는 부분은 원본의 품질,질감, 조명, 구조를 그대로 유지하는 능력이 뛰어나다.
- 멀티모달 통합: 시각 정보와 텍스트 정보를 결합하여 맥락을 파악하는 능력이 강화되었다.
2. FireRed-Image-Edit 관련 모델 다운
- FireRed-Image-Edit-1.0_fp8_e4m3fn : " https://huggingface.co/cocorang/FireRed-Image-Edit-1.0-FP8_And_BF16/tree/main "
- Text_Encoder : qwen_2.5_vl_7b_fp8_scaled 사용
- VAE : qwen-image-vae 사용
- Loras : 4steps 로 이미지를 생성하기 위하여 Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16 Lora 를 사용
2. Workflow
QWEN-Image-Edit 용 workflow 를 그대로 사용하여도 됨.
아래 이미지를 그대로 다운로드하여 Comfyui 에 drop 하면 workflow를 그대로 사용가능합니다.
![]() |
| 이미지를 편집한 결과. workflow가 그대로 들어있는 png 파일 |
3. 이미지 편집 테스트
- 배경 변경
- Prompt : The background features the Eiffel Tower in Paris, without any street and buildings behind it, and the characters blend naturally into the environment.

배경만 변경 - 의상 및 머리스타일
- Prompt : change cloths to a cloths of image 2. while maintaining the features of the person in the photo. messy hair.

이미지 2개를 병합하여 머리스타일도 변경후 결과 - 인물 90도 180도 회전
- Prompt : Rotate the character's camera angle left 90 degrees . maintain same pose.

좌 90도 회전 - Prompt : Rotate the character's camera angle 180 degrees . hands back , maintain same pose.

180도 회전 - 다중 Text
- Prompt : input text "Wishing you a wonderful 2026, good health always, and a very Happy New Year!" in bottom of image. golden color.

2026년 새해인사 - 콜라를 들고 마시는 모습
- 의상 갈아입히기
4. FireRed-Image-Edit 의 사용결과
- 이미지 편집속도가 빠르다. 대략 30~40초 정도 소요된다. 물론 qwen-image-edit-2511 도 60초 이내에 생성되지만 이 모델이 좀 더 빠르다.
- 원본 이미지의 손실이 거의 없이 원하는 부분만 잘 편집해 준다.
- 적어도 의상 갈아입히기에서는 qwen-image-edit-2511 보다 더 잘 해준다.
- text는 상당히 정확하게 표현해 준다.
지금까지 이미지 편집에 qwen-image-edit-2511 모델을 사용해 왔는데, 이제는 이 모델로 사용해도 좋겠다는 생각이 든다.






댓글
댓글 쓰기