Flux2 가 출시 되었다. Flux는 독일의 AI 연구소인 Black Forest Labs에서 개발한 최신 인공지능 이미지 생성 모델인데 Flux2 는 편집도 가능한 모델이다.
Stable Diffusion SDXL 버전을 사용하는 중에 출시된 Flux 모델을 사용해 보고 Flux 의 이미지 품질에 푹 빠졌었는데 이번에 Flux2 가 출시된 것이다. 요즈음 QWEN-Image-Edit-2509 모델과 나노 바나나 프로 3 등등 이미지 편집에 획기적인 변화가 몰려오고 있는 와중에 Flux2 또한 여기에 함께 한 듯하다.
![]() |
| Flux2-dev-gguf 모델로 만든 인포그래픽 이미지 |
1. Flux2 의 특장점 및 단점
- 고품질 및 고해상도 출력 (최대 4MP) 이 가능하다. 사실적인 디테일과 현실과 같은 이미지를 만들어 준다.
- 복잡한 텍스트를 처리하여 상당히 정확하게 잘 표현해 준다. 디자인 분야에 나노바나나 프로 처럼 매우 유용하게 사용될 수 있다.
- 다중참조 이미지(10 정도 까지)를 입력하여 원하는 이미지로 블렌딩 할 수있다.
- 다중언어 지원이 가능하기 때문에 한글로 프롬프트를 입력해도 이미지를 생성 할 수 있다.
- 다만 오픈 소스 모델로 로컬 컴퓨터에서 사용하기에는 상당한 고성능이 필요하다. 내 컴퓨터 (4070ti 16G) 그래픽 카드에서도 832 x 1536 한장 생성하는데 300초 정도가 소요된다.
- 오픈 모델 Flux2 [dev] 권장 VRAM 이 24G 이상이다. (지금은 포기가 건강에 좋을듯 하다. ㅜㅜ)
2. Flux2 모델 종류
- Flux2 [pro] : 최고급 품질의 폐쇄형 상위 모델. 빠르고 저렴한 이미지 생성 지원하며 API 를 통하여 사용가능하다.
- Flux2 [dev] : 320억 매개변수를 가진 오픈 웨이트 모델. 텍스트-이미지 생성 및 다중 입력 이미지 편집 기능이 가능하다.
- Flux2 [Flex] : 개발자가 생성 단계, 가이던스 스케일 등 파라미터를 세밀하게 제어하여 품질, 충실도, 속도의 균형을 조정 가능하다. API 를 통하여 사용가능.
- Flux2 [klein] : FLUX.2 기반의 경량화 버전 (출시 예정).
3. Flux2 사용하기 위한 모델 다운로드
- Flux2 [dev] : 원본파일 크기가 64G 이다...... 너무 커서 이 모델을 사용하기 위한 조건은 VRAM 32G 은 되어야 하지 않을까 추측해 본다.
- VRAM 16G 이하에서 어느 정도 사용 가능한 것들은
- Flux2-dev-fp8 : 대략 33G 이것도 가능하겠지만 이미지 한장 뽑는데 하 세월이 걸릴것으로 추정한다.
- Flux2-dev-gguf : 이것은 버전에 따라 크기가 있기 때문에 내 컴퓨터의 VRAM 크기에 따라 적당한 것을 골라 다운로드 하면 된다. ( https://huggingface.co/city96/FLUX.2-dev-gguf ) 이중에서 저는 Flux2-dev-Q6-K-gguf (27G) 를 받아 사용한다.
- Text Encoder : mistral_3_small_flux2_fp8 (16G) ( https://huggingface.co/Comfy-Org/flux2-dev/tree/main/split_files/text_encoders ) 이것도 너무 크지만 어쩔수 없다.
- VAE : Flux2-vae ( https://huggingface.co/Comfy-Org/flux2-dev/tree/main/split_files/vae )
4. Workflow
workflow 는 comfyui 를 최신으로 업데이트 하면 Template 에 Flux2 용 workflow가 생기기 때문에 사용 가능하다.
workflow 에서 Load Diffusion Model 노드를 Unet Loader (GGUF) 노드로 바꾸고 gguf 모델을 사용한다.
5. 이미지 생성
- prompt : An image of a young woman with a serene expression, holding a teacup with both hands. She is standing near a window, with soft, warm sunlight gently streaming in, creating a cozy and inviting atmosphere. The artwork is in a colored pencil drawing style with delicate lines and subtle shading. The color palette is soft and pastel, dominated by warm pinks for her dress, lips, and cheeks, complemented by light peach, cream, and soft lavender accents. Floral elements near the window enhance the gentle, spring-like ambiance. Her hair is styled in an elegant, slightly messy updo, with soft strands framing her face. The overall mood is calm, warm, and introspective, with a cheerful, luminous pastel tone that feels light and airy.
20 step 후 생성 소요시간이 305초 이다.
832x1216
- prompt : asterpiece, Ultra-HD, cinematic lighting, photorealistic impressionism, high detail, depth of field, soft reflections, amazing composition.Ultra-detailed full-body portrait, wide-angle lens, low angle, view from below, shallow depth of field. Subject: A 26-year-old woman with purple hair flowing over her shoulders. She wears a white office jacket over a red dress, and black thin stockings up to mid-thigh. Pose & Setting: Sitting on a chair, legs crossed, with high-heel shoes. Her hands are on the desk, and her knee is under the desk. A steaming cup of tea is on the desk. Lighting & Atmosphere: Strong chiaroscuro lighting, with a striking contrast between light and shadow; it is dramatically illuminated under the desk, and the others is submerged in deep, velvety darkness (vantablack-level shadow depth), creating a realistic and romantic atmosphere. Dark, night time setting with a moonlight beam shining through windows from the back, highlighting dust in the air. dim lighting in stocking, Focus & Perspective: ((Legs focus, hip focus)), ((close up)), from under the desk, front view.
소요시간은 311초 이다. 대략 5분정도 소요된다..jpg)
832x1536
아직은 사용하기가 너무 버겁다. 출시된지 얼마 안되어 빠르게 생성할 수 있는 다양한 Lora 가 만들어지지 않았기 때문에 조금 더 기다려 보아야 할 듯하다.

댓글
댓글 쓰기