기본 콘텐츠로 건너뛰기

스테이블 디퓨전 - PONY, Illustrious 모델들 살펴보기

 스테이블 디퓨전에서 이미지를 생성하는데 가장 중요한 요소는 Checkpoint 이다.

Checkpoint 모델들은  대략  SD1.5 --> SDXL --> SD3.5 , Pony(ani.) , Illustrious(ani.), Flux,  Sana, HiDream   등이 오픈 소스로써 로컬 환경에서 많이 사용되고 있다.
이 중에서 스테이블 디퓨전 모델은 Checkpoint 모델들은  대략  SD1.5 --> SDXL --> SD3.5 , Pony(ani.) , Illustrious(ani.) 들이고  Flux , Sana 그리고 HiDream 모델은  스테이블 디퓨전과 또 다른 모델들로 고해상도의 이미지를 생성할 수있는 모델들이다.

나는 이중에서 스테이블 디퓨전 과 Flux 모델을 주로 애용하고 있으며,  요즈음  Pony, Illustrious 모델을 사용하여 이미지를 많이 생성하고 있는데  이 모델들은 주로 애니 망가 카툰 스타일의 이미지 생성에 탁월한 기능을 발휘한다.
Pony 모델의 원조 쯤 되는 모델이미지

이번 글에서는 주로 이 모델들에 대하여 알아본다.

1. 모델 다운로드

모델이 공개된 플랫폼중 가장 많이 애용하는 곳은  Civitai 사이트 이다.
이곳은 Pony 모델 뿐 아니라 다른 여러가지 Checkpoint 모델과  Lora 모델 , 많은 이미지들을 얻을 수 있다.  이 사이트에서 필요한 모델을 찾아 다운로드 하면 된다.

2. Pony, Illustrious 모델의 특징

스테이블 디퓨전(Stable Diffusion)에서 'Pony'와 'Illustrious' 모델은 특정 스타일이나 특징을 가진 이미지를 생성하기 위해 훈련된 커스텀 체크포인트 모델이다. 스테이블 디퓨전은 기본적으로 텍스트 프롬프트를 통해 이미지를 생성하는 AI 모델이지만, 사용자들이 특정 데이터셋으로 추가 학습(파인튜닝)하여 다양한 스타일의 모델을 만들어내고 있다.

'Pony'와 'Illustrious'는 이러한 커스텀 모델 중 두 가지이며, 각각 다음과 같은 특징을 가진다. 


    2.1. Pony 모델

  • 이름 유래 및 스타일 예측: 'Pony'라는 이름은 일반적으로 어린아이들이 좋아하는 그림책 스타일, 혹은 귀여운 동물 캐릭터(특히 말)와 관련된 이미지를 연상시키는데  이 모델은 다음과 같은 특징을 가지고 있다.

    • 귀여운/카툰 스타일: 전반적으로 귀엽고 부드러운 그림체, 둥글둥글한 형태, 밝고 채도 높은 색감을 특징으로 할 수 있다. 애니메이션이나 만화 같은 느낌을 줄 수 있다.
    • 캐릭터 중심: 사람이나 동물의 캐릭터를 생성하는 데 특화되어 있을 수 있다. 특히 어린 시절의 기억이나 동화 같은 분위기를 잘 표현할 수 있다.
    • 단순화된 형태: 복잡한 디테일보다는 특징적인 형태와 색상으로 대상을 표현하는 데 중점을 둘 수 있지만,  최근에 파생된 모델들은 실사와 비슷한 디테일이 살아 있다.
    • 특정 팬덤과의 연관성: 만약 'My Little Pony'와 같은 특정 작품의 영향을 받아 학습되었다면, 해당 작품의 캐릭터나 세계관과 유사한 이미지를 생성하는 데 매우 강하다.
  • 주요 사용 목적: 주로 귀여운 캐릭터 아트, 동화 삽화, 팬아트, 아기자기한 디자인 요소 등을 생성하는 데 유용하다.


    2.2. Illustrious 모델

  • 이름 유래 및 스타일 예측: 'Illustrious'는 '뛰어난', '빛나는', '저명한' 등의 의미이다. 이는 모델이 고품질의,  회화적이거나 예술적인 느낌의 이미지를 생성하는 데 특화되어 있다.

    • 고품질/예술적인 일러스트레이션: 전문 일러스트레이터가 그린 것과 같은 높은 수준의 디테일과 완성도를 가진 이미지를 생성할 수 있다.
    • 다양한 예술 사조: 특정 스타일(예: 유화, 수채화, 디지털 페인팅, 스케치 등)에 강할 수도 있고, 여러 예술 사조를 아우르는 범용적인 고품질 일러스트레이션을 목표로 할 수도 있다.
    • 사실적이면서도 예술적인 표현: 단순히 사진처럼 사실적인 것을 넘어, 작가의 해석이나 미적 감각이 반영된 일러스트레이션에 강점을 보일 수 있다.
    • 세밀한 묘사: 배경, 인물, 사물 등의 디테일한 묘사에 뛰어나서 시각적으로 풍부한 이미지를 만들어낼 수 있다.
  • 주요 사용 목적: 책 삽화, 게임 컨셉 아트, 디지털 페인팅, 고품질 배경 이미지, 광고 일러스트 등 전문가 수준의 일러스트레이션이 필요한 작업에 적합할 수 있습니다.

개인적으로 두가지 모델을 사용해서 이미지를 생성하고 있지만 그다지 구분해서 사용한 적은 없다.
동일한 프롬프트로 다양한 Checkpoint 를 바꿔가며 이미지를 생성해 보면 서로 다른 느낌의 이미지들이 만들어 지고 그 중에서 내 마음에 드는 이미지가 만들어 질 뿐이다.
그래서 두가지 모델을 구분없이 사용하고 있다.

3. 쓸만한  Checkpoint 모델

    Pony 모델의 원조 격인 모델은  "Pony Diffusion V6 XL" 이다.  여기서 많은 모델들이 파생되어 생성된 것으로 본다.
Pony 모델을 사용해 보면 대략 3가지 정도로 나눌 수 있다.
  • 일반적인 Pony 모델 :  
    • Pony Diffusion V6 XL : 원조 Pony 모델
    • duchaitenPonyXLNo_v60 : 상당히 디테일하고 그림체도 예쁘고 반 실사 느낌의 모델로 자주 애용하는 모델 중 하나이다.

duchaitenPonyXLNo_v60

    • meichidarkmixReload_meichidarkSensualV3 : 이 모델도 duchaiten 모델과 유사한데 얼굴 이미지가 다르다.   사실적인 느낌도 많이 나온다. 다른 느낌의 모델이기 때문에 권할만 하다.
 
meichidarkmixReload_meichidarkSensualV3 

    • littleoctopusmixMF_v20 : 이 모델은 실사 느낌과 스케치나 수채화 느낌의 이미지를 잘 만들어 준다. 

littleoctopusmixMF_v20
  • 실사 느낌의 모델들
    • waiANIHENTAIPONYXL_v60 : 상당히 실사적인 이미지를 잘 만들며, 특히 동양 여성의 이미지가 예쁘게 나온다.
waiANIHENTAIPONYXL_v60

    • novaAsianXL_v50 : 동양 여성의 얼굴을 잘 만들어 주는 모델

novaAsianXL_v50
  • 스케치, 망가 , 카툰 이미지 모델들
    • comix3_v10 : 코믹 망가 스타일의 이미지를 생성해 준다.

comix3_v10

    • hsArtAnime_ill30 : 카툰, 웹툰 스타일을 잘 만들어 준다.

hsArtAnime_ill30

Pony 모델들은 실사, 반실사, 카툰, 망가, 웹툰 스타일들을 다양하게 만들어 준다.

상기에 언급한 모델들은 30여종의 모델들을 사용해 보고 개인적으로 많이 애용하고 있는 모델들을 나열 하였다.  다른 파생된 모델들도 개인의 취향에 맞는 이미지를 만들어 주는 모델들이 많기 때문에 직접 다양한 모델들을 다운로드하여 이미지를 만들어 보아야 각각의 모델들의 특징을 잘 알 수 있다.

덧붙여 Pony 모델은 인체의 포즈를 잘 나타내고, NSFW 이미지도 쉽게 만들기 때문에  사용에 주의를 요한다.

남편을 기다리는 아내의 모습

점점 AI의 기술이 너무 빨리 발전되어  너무나 좋은 이미지를 내 컴퓨터에서도 만들 수있기 때문에 다양한 목적으로 이용할 수 있다고 생각한다.  이미지의 품질을 높이고 이미지를 확대하고 이미지의 일부를 수정하는 작업은 온라인상의 많은 AI 플랫폼을 이용하면 쉽게 할 수 있다.



댓글

이 블로그의 인기 게시물

Comfyui Wildcard 사용법 - Stable Diffusion , Flux 에서 쉽게 Random Prompt 로 이미지 만들기

 Comfyui Wildcard 사용법에 대하여 알아본다. Comfyui 로 Stable Diffusion 또는 Flux 로 이미지를 만들 때 Prompt 가 이미지를 결정하는데 매우 중요한 역할을 한다.  영어가 모국어가 아닌 이상 영어로 prompt 를 만드는 것이 참 어려운 일이다. 물론 처음에는 많은 다른 사람들이 사용한 prompt 들을 모방하여 수정하고 사용하는데 이런 일을 하나하나 해 보기가 시간이 많이 걸리고 어렵다.   그래서 Random 으로 prompt 가 만들어 져서 이미지가 생성되고 그 이미지 중에서 마음에 드는 이미지들을 골라 그 이미지의 Prompt들 만을 가지고 보완하고 개선하면 더 편리하고 좋지 않을까 생각이 든다.  그런 식의 Random Prompt 생성이 가능하게 해주는 것이 wildcard 사용이다. Joker는 card game에서 wildcard 이다. 1. Wildcard 의 의미      와일드 카드(Wildcard)란 카드 게임에서 유래되었다.  이런 카드 게임에서 모든 카드의 대용으로 쓸 수 있는 비장의 카드를 와일드 카드라고 한다. 포커나 훌라를 할 때 조커가 이런 역할을 하는데 ,  이 의미가 컴퓨터와 스포츠로 확장되어 사용되는 것이다. 컴퓨터 용어로 쓰일 때는 한 디렉터리 내에 여러 파일이 존재하거나, 파일 이름의 뒷부분을 정확히 알지 못하는 경우에도 사용할 수 있는 명령어를 말합니다. '*'을 넣으면 빠진 것에 어떤 문자열이 있든지 대신할 수 있고,  '?'는 임의의 한 문자에만  대응한다. Comfyui 에서 wildcard 사용은 "--문자열--"  이런 식으로 wildcard 사용 가능한 노드에 prompt 를 입력해 주면 그 노드는 "문자열" 에  해당되는 파일을 찾아 그 파일 내용 중에서 임의의 일부분을 prompt 로 대체해 준다. 2. Wildcard 사...

Flux Lora 제작 - Local 에서 Fluxgym 을 이용하여 자체 Lora 만들기

 Flux Lora 는 일관된 이미지를 만드는데 꼭 필요하다. 특히 일관된 얼굴의 이미지를 만드는데 있어서 다른 기능들 (ipadapter , controlnet, imgtoimg 등) 을 이용하는 것 보다 훨씬 일정한 캐릭터를 생성하게 해준다.  문제는 이런 Lora는 주로 CIVITAI , Tensor, Hugging face 등 사이트에서 다운 받아 사용하면 되지만  그것은 나만의 독특한 캐릭터가 아니고 나의 취향과 일치 되기가 어려워서 Lora를 구하기가 어렵다.  아니면 그런 사이트 내에서 자체 Lora를 제작하면 되는데 모두 비용이 필요하다. 여기 소개하는 Fluxgym AI 는 Local 컴퓨터에서 VRAM 12G 이상이면 자체 Lora를 만들 수 있게 해준다.   소요되는 시간도 생각보다 많이 걸리지 않는다.   이제 설치하고 자체 Lora를 한번 만들어 보자. Fluxgym 으로 만든 Lora 대표이미지 1. fluxgym 설치 pinokio 앱을 실행한다. ( pinokio 앱 설치 참조 ) 우측 상단 맨 처음 아이콘 (discover) 클릭 fluxgym 을 찾아서 클릭 fluxgym 이것을 클릭하면 된다. 여러가지 파일들을 설치하기 때문에 시간이 좀 소요될 것이다. 모든 설치가 끝나면 pinokio 브라우저 하단 부분에 fluxgym 메뉴가 추가된다. fluxgym 나중에 불필요하면 삭제(쓰레기통 아이콘 클릭) 하면 모두 unintall 된다. 2. fluxgym 실행 항상 pinokio 앱을 실행하여 pinokio 브라우저에서 fluxgym 을 클릭하면 된다. flux화면3-1 -. 1번항 : 여기에 입력한 대로 fluxgym/outputs/ 의 하위 폴더를 만들어 준다. -. 2번항 : Lora를 작동시키는 trigger word 를 입력한다. (예,  hart_style_a......) -. 3번항 : 자신의 가능한 VRAM 선택 : 나는 12 G 선택 ...

Pinokio 앱 설치 - 오픈 소스 AI 플랫폼

  Pinokio 는 오픈 소스 AI 플랫폼이다. 로컬에서 AI 애플리케이션을 쉽게 설치하고 실행할 수 있게 도와주는 오픈 소스 AI 플랫폼이다. 이 플랫폼은 사용자가 복잡한 설치 과정 없이 클릭 한 번으로 AI 도구들을 설치할 수 있도록 설계되어 있다. 이를 통해 기술적인 배경 지식이 없는 초보자나 비전문가들도 쉽게 AI 애플리케이션을 사용할 수 있다.   이미 설치되어 있는 애플리케이션이 있어도 별도의 독립된 공간에서 문제없이 사용할 수 있게 해준다.   우리가 stable diffusion 을 comfyui 에서 사용하기 위해서는 "Python", "git ....", "conda"  뭔지 모르지만 설치해야 하는데 pinokio 브라우저에서 원 클릭으로 알아서 설치를 해주기 때문에  컴맹인 일반인도 쉽게 설치하고 사용 할 수 있다. pinokio.computer 1. Pinokio 주요 기능 원클릭 설치 : 복잡한 환경 설정이나 명령어 입력 없이도 다양한 AI 모델을 한 번의 클릭으로 설치할 수 있다. 예를 들어, Comfyui 나 Flux 같은 AI 도구들을 손쉽게 설치할 수 있다. 다양한 AI 애플리케이션 제공 : Pinokio는 다양한 오픈 소스 AI 애플리케이션을 제공하는 허브 역할을 하며, Pinokio 브라우저 나 홈페이지에서 쉽게 찾아 설치할 수 있다. 브라우저 기반 인터페이스 : 모든 설치된 애플리케이션은 Pinokio 웹 브라우저에서 관리할 수 있어, 친숙한 인터페이스로 쉽게 사용이 가능하다. 독립적인 가상 컴퓨터 : Pinokio는 백엔드 작업을 자동으로 처리하여, 애플리케이션이 로컬에서 실행되는 동안 인터넷에 연결되어 있지 않아도 된다. 2. Pinokio 설치 구글에서 pinokio 를 검색하여 " pinokio.computer " 를 클릭 Download 클릭 다운로드 된 pinokio 압축 파일을  푼다. pinokio 설치파일을 실행하여 설치 설치과정은 복...