기본 콘텐츠로 건너뛰기

9월, 2025의 게시물 표시

한글 Prompt 사용 - QWEN 이미지 생성 AI

Prompt(프롬프트) 란 이미지 생성을 지시하는 요구 조건들의 명령어 이다. 보통 프롬프트는 영어로 작성을 하여 사용한다. Stable Diffusion, Flux, QWEN, Hidream, Midjourney , Wan 등등  모든 이미지 생성용 모델들은 영어로 작성하여 사용하면 된다. 한글은 인식을 못한다.  다만 QWEN 은 한글 프롬프트도 잘 해석해서 만들어준다.  그리고 동영상 제작 모델인 Wan 모델도 상당히 한글 프롬프트를 해석해서 만들어준다.  QWEN 모델은 중국 알리바바에서 만든 모델이여서 인지 한자 뿐만 아니라 한글도 인식을 잘 한다. 여기서는 QWEN을 이용하여 한글 프롬프트를 사용하여 본다. QWEN모델로 한글 프롬프트를 입력하여 만든 이미지 1. QWEN 모델 사용을 위한 Workflow     Comfyui 에 보면 browses 에 QWEN 용 workflow template 이 있기 때문에 불러서 사용한다.    QWEN text to image workflow Template 에서 QWEN 이미지 생성용 workflow 를 불러오면 거기에는 필요한 모델들의 링크주소가 있기 때문에 쉽게 다운받아 적용할 수있다. 2. 각 모델과 사용조건 Checkpoint : qwen_image_fp8_e4m3fn CLIP Model : qwen_2.5_vl_7b_fp8_scaled VAE Model : qwen_image_vae Lora Model : Qwen-Image-Lightning-8steps-v1.0 Sampler : res_2s (없으면 euler) Scheduler : bong_tangent (없으면 simple) steps : 8 steps cfg : 1.0 3. 간단한 prompt 를 입력하고 실행     Prompt :  A beautiful woman, wearing a tight-fitting red dress, a red l...

Stable Diffusion 또는 Flux 를 사용하기위한 툴 - Automatic1111 과 Comfyui

 Stable Diffusion 또는 Flux 를 사용하기위한 툴 중에서 대표적인것은 Automatic1111 과 Comfyui 이다. 나도 처음에는 Automatic1111 web UI 를 사용했었는데 사용상의 한계가 있어서 Comfyui 로 옮겨 현재까지 사용 중이다. 보통 초보자에게는 Automatic1111 이 좀 더 쉽게 이미지를 생성할 수 있는데 점점 이미지 생성 노하우가 높아지면 Comfyui 가 훨씬 더 사용하기 좋은 툴 이라는 것을 알 수 있다. Comfyui 에서 QWEN 모델로 생성한 이미지 1. Automatic1111 과 Comfyui 비교 항목 Automatic1111 (A1111) ComfyUI 출시 시기 2022년 8월 (Stable Diffusion UI) 2023년 1월 발표 기본 UI 방식 Gradio 기반 여러 탭 → 입력창, 슬라이더 중심 노드 기반 워크플로우 (flowchart) 인터페이스 사용 난이도 초보 사용자에게 친숙 (빠른 시작 가능) 중급~고급 사용자를 위한 도구 (처음엔 복잡) 기능 및 확장성 텍스트 → 이미지, 이미지 변경(인페인팅), ControlNet, LoRA 등 다양한 확장 노드 연결로 복잡한 흐름 구성 가능, 최신 모델·기능 추가가 빠름 성능 & 메모리 관리 VRAM 사용량 높고 큰 이미지 처리 시 불안정할 수 있음 메모리 효율 매우 좋고 빠름 (“몇 분 걸리던 작업이 수십초에”) 노드/확장 수 확장 기능 300개 이상 존재 600여 개 이상 custom node 등 강력한 생태계 개인적으로 설치하는 방법은 Automatic 보다는 Comfyui 가 더 쉽고 편하게 할 수 있었다. 몇 개월 전만해도 Comfyui 는 설치 후 Workflow 를 구성하는데 초보자들 에게는 상당히 어려운 작업이였지만, 지금은 Workflow browse Templates  에서 사용하고 싶은 Workflow 를 선택하여 사용하기 때문에 쉽게 세팅을 할 수 있어서 초보자들에게도 적합한 툴이...

Qwen-Image-Edit - comfyui 를 이용하여 image 를 편집한다. (1)

 Qwen-Image-Edit은 20B 규모의 Qwen-Image 모델을 기반으로 훈련된 이미지 편집 모델이다. 기존 Qwen-Image 모델이 가지고 있던 고유한 텍스트 렌더링 기능을 편집 작업으로 확장하여, 이미지 편집 분야에서 강력한 성능을 보여준다. QWEN-Image-Edit 를 이용한 결과 기존의 사진이나 이미지들을 편집하는 것은 주로 photoshop 으로 많이 하는데 , 요즈음은  이미지 편집 AI 를 이용하여 간단한 것들을 쉽게 편집하고 있다.    물론 아주 세밀한 작업은 photoshop 툴을 이용하는것이 좋겠지만 여기에 사용되는 다양한 이미지 편집은 Flux-Kontext 나 QWEN-Image-Edit 등을 이용하는 것이 훨씬 편하고 자연스럽다. 1. 사용 Model 다운로드 및 설치 Qwen_Image_Edit-Q5_K_S : 여기서는 이미지 생성 속도를 위하여 gguf 모델을 다운받아 사용하였다.  " https://huggingface.co/QuantStack/Qwen-Image-Edit-GGUF/tree/main " 에서 적합한 모델을 다운받아   Comfyui 의 models\unet 폴더에 설치한다. qwen_2.5_vl_7b_fp8_scaled : CLIP 모델은 " https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/blob/main/split_files/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors " 에서 다운로드 하거나 찾기 어려우면 구글에서 검색하여 찾아서 설치하자. qwen_image_vae : VAE 모델 기존 QWEN 모델에서 사용한 것을 그대로 사용한다. Qwen-Image-Edit-Lightning : 이 로라 파일은 적은 스텝으로 이미지를 생성할 수 있기 때문에 이미지 편집 생성 시간을 단축시킬 수 있다.  " https:/...