기본 콘텐츠로 건너뛰기

이미지에서 프롬프트 추출하기 in Comfyui - QWEN3-VL

 이미지 또는 사진에서 Prompt(프롬프트)를 추출하여 사용하기

네이버, 구글 또는 핀터레스트 등의 사이트에서 마음에 드는 사진을 보고 비슷한 이미지를 만들고 싶을때,   그 사진을 보고 직접 그것을 프롬프트로 만들기가 어려운 일이다.  만들었다고 해도 그것을 이용하여 이미지를 생성해 보면 원하는 이미지와는 동 떨어진 이미지가 만들어지기 쉽다.

그래서 보통은 chatGPTGEMINI 를 이용하여 이미지를 업로드하고 프롬프트를 만들어 달라고 하여 추출한다.  나도 이런 방식으로 종종 프롬프트를 추출하여 사용하곤 한다.

여기에서는 외부 도움을 받아 추출하는 대신  내 컴퓨터에서 추출하여 사용하는 방법이다.

1. 이미지에서 프롬프트 추출 예


Z-Image-Turbo 로 만든 이미지
위의 이미지에서 프롬프트를 추출 한다면......
  • chatGPT : A soft, elegant portrait of a young woman sitting on the floor, painting flowers with a brush and a palette. She wears a crisp white shirt with rolled-up sleeves and fitted blue jeans. Her long dark hair flows naturally as she focuses calmly on her artwork. A vase filled with colorful roses stands beside her. The scene has a warm beige background, smooth lighting, clean details, and a serene, gentle atmosphere. Ultra-high-definition, photorealistic illustration, soft shadows, pastel tones, refined skin texture, delicate rendering.
  • GEMINI : A beautiful, elegant East Asian woman sitting barefoot on the floor, wearing a loose white button-down shirt and form-fitting blue jeans. She is holding a fine paintbrush in her right hand, poised to touch a palette of watercolors held in her left hand. Next to her is a white ceramic vase with a bouquet of realistic, pastel-colored flowers (roses, perhaps some greenery). The setting is a minimalist studio with a solid, neutral beige or light tan background, emphasizing soft, natural studio lighting. Highly detailed, photorealistic, cinematic light, 8k.
  • Qwen3-VL :  A serene, softly lit studio portrait of an elegant young woman with long dark hair sitting cross-legged on a warm beige floor, wearing a crisp white button-up shirt and slim-fitting blue jeans; she holds a paintbrush in one hand and a small palette with vibrant colors in her other — poised as if about to sketch or paint — beside her is a simple cream-colored vase filled with delicate flowers including roses and eucalyptus leaves; gentle natural light illuminates her focused expression and soft features against a minimalist background, evoking calm creativity and artistic grace.  Style: Photorealistic digital illustration / Soft lighting / Minimalist composition.  Mood: Calm, contemplative, creative focus.  Tools/Style Note (for Z-Image): Use high-resolution rendering mode + realistic skin texture + subtle depth-of-field blur for backgrounds  이것보다 훨씬 더 상세하게도 추출하여 준다.

2. 필요한 모델과 노드들

  • 필요한 모델은 QWEN3-VL- xxxxx  들인데 이것들을 다운받아 먼저 설치해도 되지만, 아래 노드들을 설치하고 실행하면 맨 처음에 필요한 모델이 자동적으로 다운 받아 설치된다.
  • 필요한 노드 설치 : comfyui manager 에서 설치한다. 
    comfyui-QwenVL 노드

  • 다른 비슷한 노드들도 있는데 내가 설치한 노드는 위의 노드들이며, 이것만 있으면 된다.

3. Workflow


Workflow

  • model_name : Qwen3-VL 중 자신의 컴퓨터 성능에 따라 선택
  • quantization : 4-bit, 8-bit, None(16) 에서  컴퓨터 성능에 따라 모델과 관련하여 선택
  • preset_prompt : 프롬프트를 어느 정도 상세히 분석할 것인가 를 선택하고  그 아래 입력란에 요청할 사항을 프롬프트로 입력한다.
    • 예) You are a professional photographer. Analyze the photo in detail, including the subject, clothing, and pose. Pay particular attention to the clothing.   
    • 당신은 전문 사진작가입니다. 피사체, 의상, 포즈 등 사진을 자세히 분석하세요. 특히 의상에 더 주의를 기울이세요.
  • max_tokens : 분석하여 추출할 프롬프트의 최대 길이.   이 숫자가 클수록 상당히 긴 분석된 프롬프트를 만들어 준다. 
  • 기타 다른것은 디폴트값 그대로 사용하였다.

4. 프롬프트 추출 실행

  • 이미지를 업로드하고 
    Image upload

  • Model : Qwen3-VL-8B-instruct
  • quantization : 8-bit(Balanced)
  • preset-prompt : Detailed Description ( You are a professional photographer. Analyze the photo in detail, including the subject, clothing, and pose. Pay particular attention to the clothing. )
  • max-tokens : 512
  • 실행후 추출 프롬프트 :  상당히 길게  그리고 의상은 매우 상세히 서술하여 만들어 주었다.
  • 소요시간 : 74초
  • 추출된 프롬프트를 사용하여 Z-Image-Turbo 모델로 생성한 이미지 
    Z-Image-Turbo
    Z-Image-Turbo 모델은 사용해 볼수록 생각보다 훨씬 더 쓸만한 이미지 생성형 AI 모델이다.  만든 이미지가 원본의 느낌이 비슷하게 많이 보인다.

5. 결론 

추출된 프롬프트를 CLIP Text Encode (Prompt) 노드에 바로 연결 사용하면 Z-image-turbo 에서 쉽고 빠르게 비슷한 이미지가 만들어 진다.

처음 이미지에서 추출한 프롬프트로 Z-Image-Turbo 로 만든 이미지 

이 글 맨 처음의 원본 이미지와 상당히 비슷하게 만들어 진다.
프롬프트를 만드는데 어려움을 느낀다면 이런 방법으로 마음에 드는 좋은 이미지에서 프롬프트를 추출하여 여러가지 모델로 이미지를 만들어 보면 프롬프트에 좀 더 빨리 익숙해 질 수 있다.

벌써 2025년의 마지막 달 4일입니다.  오늘은 유난히 춥고 눈도 제법 많이 오고 있네요.
이럴때는 몸 사리며 건강 조심해야 합니다.






댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...