기본 콘텐츠로 건너뛰기

Flux2 에 대한 소개 - Flux2-dev

Flux2 가 출시 되었다.  Flux는 독일의 AI 연구소인 Black Forest Labs에서 개발한 최신 인공지능 이미지 생성 모델인데 Flux2 는 편집도 가능한 모델이다. 

Stable Diffusion SDXL 버전을 사용하는 중에 출시된 Flux 모델을 사용해 보고 Flux 의 이미지 품질에 푹 빠졌었는데 이번에 Flux2 가 출시된 것이다.  요즈음  QWEN-Image-Edit-2509 모델과 나노 바나나 프로 3 등등  이미지 편집에 획기적인 변화가 몰려오고 있는 와중에 Flux2 또한 여기에 함께 한 듯하다.
Flux2-dev-gguf 모델로 만든 인포그래픽 이미지


1. Flux2 의 특장점 및 단점

  • 고품질 및 고해상도 출력 (최대 4MP) 이 가능하다.  사실적인 디테일과 현실과 같은 이미지를 만들어 준다. 
  • 복잡한 텍스트를 처리하여 상당히 정확하게 잘 표현해 준다.  디자인 분야에 나노바나나 프로 처럼 매우 유용하게 사용될 수 있다.
  • 다중참조 이미지(10 정도 까지)를 입력하여 원하는 이미지로 블렌딩 할 수있다.
  • 다중언어 지원이 가능하기 때문에 한글로 프롬프트를 입력해도 이미지를 생성 할 수 있다.
  • 다만 오픈 소스 모델로 로컬 컴퓨터에서 사용하기에는 상당한 고성능이 필요하다.   내 컴퓨터 (4070ti 16G) 그래픽 카드에서도 832 x 1536 한장 생성하는데 300초 정도가 소요된다.
  • 오픈 모델 Flux2 [dev] 권장 VRAM 이 24G 이상이다. (지금은 포기가 건강에 좋을듯 하다. ㅜㅜ)

2. Flux2 모델 종류

  • Flux2 [pro] : 최고급 품질의 폐쇄형 상위 모델. 빠르고 저렴한 이미지 생성 지원하며 API 를 통하여 사용가능하다.
  • Flux2 [dev] : 320억 매개변수를 가진 오픈 웨이트 모델. 텍스트-이미지 생성 및 다중 입력 이미지 편집 기능이 가능하다. 
  • Flux2 [Flex] : 개발자가 생성 단계, 가이던스 스케일 등 파라미터를 세밀하게 제어하여 품질, 충실도, 속도의 균형을 조정 가능하다.  API 를 통하여 사용가능.
  • Flux2 [klein] : FLUX.2 기반의 경량화 버전 (출시 예정).

3. Flux2 사용하기 위한 모델 다운로드

  • Flux2 [dev] : 원본파일 크기가 64G 이다......   너무 커서 이 모델을 사용하기 위한 조건은 VRAM 32G 은 되어야 하지 않을까 추측해 본다.
  • VRAM 16G 이하에서 어느 정도 사용 가능한 것들은
    • Flux2-dev-fp8 : 대략 33G 이것도 가능하겠지만 이미지 한장 뽑는데 하 세월이 걸릴것으로 추정한다.
    • Flux2-dev-gguf : 이것은 버전에 따라 크기가 있기 때문에 내 컴퓨터의 VRAM 크기에 따라 적당한 것을 골라 다운로드 하면 된다. ( https://huggingface.co/city96/FLUX.2-dev-gguf )  이중에서 저는 Flux2-dev-Q6-K-gguf (27G) 를 받아 사용한다.
  • Text Encoder : mistral_3_small_flux2_fp8 (16G) ( https://huggingface.co/Comfy-Org/flux2-dev/tree/main/split_files/text_encoders ) 이것도 너무 크지만 어쩔수 없다.
  • VAE : Flux2-vae ( https://huggingface.co/Comfy-Org/flux2-dev/tree/main/split_files/vae )

4. Workflow

    workflow 는 comfyui 를  최신으로 업데이트 하면 Template 에 Flux2 용 workflow가 생기기 때문에  사용 가능하다.
workflow 에서 Load Diffusion Model 노드를 Unet Loader (GGUF) 노드로 바꾸고 gguf 모델을 사용한다.


5. 이미지 생성

  • prompt : An image of a young woman with a serene expression, holding a teacup with both hands. She is standing near a window, with soft, warm sunlight gently streaming in, creating a cozy and inviting atmosphere. The artwork is in a colored pencil drawing style with delicate lines and subtle shading. The color palette is soft and pastel, dominated by warm pinks for her dress, lips, and cheeks, complemented by light peach, cream, and soft lavender accents. Floral elements near the window enhance the gentle, spring-like ambiance. Her hair is styled in an elegant, slightly messy updo, with soft strands framing her face. The overall mood is calm, warm, and introspective, with a cheerful, luminous pastel tone that feels light and airy.

  • 832x1216
    20 step 후 생성 소요시간이 305초 이다.

  • prompt : asterpiece, Ultra-HD, cinematic lighting, photorealistic impressionism, high detail, depth of field, soft reflections, amazing composition.Ultra-detailed full-body portrait, wide-angle lens, low angle, view from below, shallow depth of field. Subject: A 26-year-old woman with purple hair flowing over her shoulders. She wears a white office jacket over a red dress, and black thin stockings up to mid-thigh. Pose & Setting: Sitting on a chair, legs crossed, with high-heel shoes. Her hands are on the desk, and her knee is under the desk. A steaming cup of tea is on the desk. Lighting & Atmosphere: Strong chiaroscuro lighting, with a striking contrast between light and shadow; it is dramatically illuminated under the desk, and the others is submerged in deep, velvety darkness (vantablack-level shadow depth), creating a realistic and romantic atmosphere. Dark, night time setting with a moonlight beam shining through windows from the back, highlighting dust in the air. dim lighting in stocking, Focus & Perspective: ((Legs focus, hip focus)), ((close up)), from under the desk, front view.

  • 832x1536
    소요시간은  311초 이다.  대략 5분정도 소요된다.
좀 더 큰 사이즈 2048x2048 정도는 10분 정도가 소요된다. 
아직은  사용하기가 너무 버겁다.    출시된지 얼마 안되어 빠르게 생성할 수 있는 다양한 Lora 가 만들어지지 않았기 때문에 조금 더 기다려 보아야 할 듯하다.

6. 사용 소감

    생성된 이미지의 결과물은 원하는 것을 고급 품질로 잘 만들어 준다.  광고/디자인 종사자들에게는 권장할만한 좋은 이미지생성 모델은 맞다.  다만 나처럼 이미지 생성을 취미로 한다면 그리고 고급사양의 컴퓨터가 아니라면 Flux2 보다는 차라리 Z-image 모델을 이용하여 이미지를 만들고 그 이미지를 upscale 하여 사용할 것이다.   Flux2 모델을 사용하고 싶지만 소요시간이 많이 걸려 짜증스럽다.  이번에 컴퓨터를 업그레이드 해야 하나  한번 쯤 생각해 보지만 엔비디아 그래픽카드가 고가이기 때문에 몇년은 포기할 수 밖에 없다.  아쉽지만  Flux2 는 꼭 필요할 때 만 사용할 예정이다.

  







댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...