기본 콘텐츠로 건너뛰기

Featured Post

hsArtAnime_pony10 - Pony 계열 checkpoint

hsArtAnime_pony10 모델은 Pony 계열 checkpoint 중에서 눈이큰 귀여운 애니케릭스타일의 이미지를 잘 생성해 준다. 좀 더 귀여운 그리고 눈이 큰 케릭터의 애니 이미지를 원한다면 이 모델을 CIVITAI 사이트에서 다운받아 사용하기를 권한다. 좀 더 귀여운 이미지 이다 Prompt 들은 이전 포스팅 (  meichidarkmixReload_SensualV3 - Pony Checkpoint Model  ) 에서 사용한 그대로를 사용하였다. 저번 이미지와 이 포스팅의 이미지를 비교해 보면 좀 더 쉽게 차이를 알아 볼 수 있다. 1. 여성인물 옆모습 side view 2. 풍경 풍경 3. 카페에서... 여성케릭터 카페에서 4. 망가 꼬마 케릭 꼬마 케릭 5. 커피한잔 커피한잔 6. 중세 여기사 중세 여기사 7. 카툰 여성 케릭터 카툰 스타일 8. 파스텔 컬러 파스텔 컬러 9. 기타 이미지들 화보 스타일 귀여운 여학생 여행자 프로필 사진 야외 배경 이미지 from below 귀여운 여학생 대부분의 이미지들이 눈이 크고 얼굴이 둥근 형태의 귀여운 애니 케릭터를 잘 표현해 준다. 이 checkpoint 모델도 많이 이용하는 Pony 계열 모델이다.
최근 글

meichidarkmixReload_SensualV3 - Pony Checkpoint Model

 Pony Model Checkpoint 중에서 개인적으로 가장 좋아하는 것은 meichidarkmixReload_SensualV3 모델이다. 이 모델은 CIVITAI 사이트에서 다운 받을 수 있다. 이 모델은 Pony 모델이지만 상당히 실사 이미지에 가까운 이미지 생성을 잘 해주며, 이미지 품질도 상당히 뛰어나기 때문에 애니 풍이나 웹툰 스타일의 이미지 생성에 매우 적합한 모델이라고 생각한다. 그래서 이번 포스팅에서는 이 모델을 이용하여 다양한 이미지를 생성해 보도록 한다. 동화같은 이미지에는 Pony 계열 모델이 좋다 1. 여성 인물 옆모습 prompt :  score_9, score_8_up, score_7_up, ((Expressiveh:1.3)), rating_safe,  bold_monochrome,((cartoon style:1.3)),anima character, abstract art, swirling pattern, This image is an artistic black-and-white design:  a woman wearing red gown and a wide-brimmed hat. white skin, The gown has a deep V-neckline and a fitted bodice that flares out at the bottom, The dress's design is intricate, with vertical stripes of varying widths that cascade down the length of her body. The woman has long, flowing hair that appears to be gently blowing in the wind. Her body is depicted using smooth, flowing curves, creating a sense of elegance and movement. The design emphasizes a n...

Pony 모델이란 ? - Stable Diffusion

  Pony 모델 은 Stable Diffusion 기반으로 발전한 2D 일러스트 특화 이미지 생성 모델 이다. 특히 애니메이션·만화 스타일, 캐릭터 중심 이미지 에 강점을 보이며, 세밀한 표정 표현과 선명한 색감, 또렷한 라인 묘사를 잘 해준다. Pony 모델 1. Pony 모델 특징 2D 애니풍 캐릭터 표현에 매우 강함 눈, 머리카락, 피부톤 표현이 정교함 선명한 윤곽선과 대비가 뚜렷한 색감 감정 표현(웃음, 당황, 몽롱함 등)이 잘 살아남 여성의 포즈를 잘 만들어준다 제한없는 NSFW 이미지 생성이 가능하다 2. checkpoint     다음 checkpoint   들은 CIVITAI 사이트에서 찾아 다운 받을 수 있다. Pony Diffusion V6 (기본 베이스) : pony 모델의 가장 기본인 모델이다.  이 모델로 부터 다양하게 train 된 버전들이 존재한다. Pony V6 Civitai 에서 찾아보면 이런 사진을 가진 Pony Diffusion V6 모델을 찾을 수 있다. meichidarkmixReload_meichidarkSensualV3 :  "MeichiDarkMix_Reload" 로 검색하여 "meichiDark_Sensual_V3 를 선택하여 다운로드한다. Sensual_V6 버전 상당히 웹툰, 반 실사적인 애니풍 이미지를 만들어 주는 모델이다.  개인적으로 가장 선호하는 모델이다. littleoctopusmixMF_V20 : "littleoct" 로 검색하면 찾을 수 있다.  그중에서 V2.0 버전을 다운로드 한다. V2.0 버전 이것은 좀 더 만화적인 느낌의 이미지를 잘 만들어 준다.  그래서 3.0 보다는 2.0 을 선호한다. 참고로 버전이 높다고 해서 좀 더 좋은 이미지를 만들어 주는 것이 아니고 이미지 스타일이 다른경우가 많기 때문에 마음에 드는 checkpoint 는 그 버전 그대로 사용 하는것을 권한다 . eternalChamponD...

막강한 이미지 편집모델 - FireRed-Image-Edit-1.0

 FireRed-Image-edit이란? FireRed-Image-edit은 텍스트 기반의 지시어(Instruction)를 통해 이미지를 편집하는 최신 LMM (Large Multimodal Model) 기반 편집 모델이다. 기존 모델들이 복잡한 편집 명령을 수행할 때 이미지의 엉뚱한 부분을 바꾸거나 화질을 저하시키는 문제를 해결하기 위해 등장했다. 개인적으로 오픈소스 중에서 이미지 편집모델은 Qwen-Image-Edit-2511 이 가장 좋았다. 그런데 이번에 출시된 FireRed-Image-Edit -1.0 버전도  상당히 마음에 드는 이미지 편집모델이다. FireRed-Image-Edit-1.0 1. 주요 특징 정교한 지시어 이해: "배경의 사과를 오렌지로 바꿔줘"와 같은 구체적인 자연어 명령어를 정확히 수행한다. 내용 보존 ( Content Preservation ): 수정이 필요 없는 부분은 원본의 품질,질감, 조명, 구조를 그대로 유지하는 능력이 뛰어나다. 멀티모달 통합: 시각 정보와 텍스트 정보를 결합하여 맥락을 파악하는 능력이 강화되었다. 2. FireRed-Image-Edit 관련 모델 다운 FireRed-Image-Edit-1.0_fp8_e4m3fn : " https://huggingface.co/cocorang/FireRed-Image-Edit-1.0-FP8_And_BF16/tree/main " Text_Encoder :  qwen_2.5_vl_7b_fp8_scaled 사용 VAE : qwen-image-vae 사용 Loras : 4steps 로 이미지를 생성하기 위하여 Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16 Lora 를 사용 2. Workflow     QWEN-Image-Edit 용 workflow 를 그대로 사용하여도 됨. 아래 이미지를 그대로 다운로드하여 Comfyui 에 drop 하면 workflow를 그대로 사용가능합...

Checkpoint, Text Encoder, VAE — 이미지 생성 AI의 3대 핵심 구조 정리

 컴퓨터에서 이미지를 생성할 때 Checkpoint, Text Encorder, VAE 는 이미지 생성의 3대 핵심 구조이다. 이 3가지는 세트 개념으로 이해하고 항상 함께 사용할 때 정상적인 이미지가 생성되기 때문이다. 서로 다른 것들을 연결하여 사용하면 정상적인 이미지 생성을 기대하기 어렵다. Checkpoint + Encorder + VAE 1. 이미지 생성에 필요한 핵심구조 이해 Checkpoint 또는  Diffusion Model : 이미지를 실제로 만들어내는 핵심 모델로 이것에 의해 이미지 생성이 가능하다. Text Encorder : 글을 번역하는 번역기로 우리가 입력하는 Text(Prompt) 를 AI가 이해하는 언어(숫자 벡터)로 바꿔주는 번역기이다.  번역된 내용(Conditioning)으로 checkpoint 에서 이미지를 생성한다. VAE : 잠재적 공간(latent)으로의 변환을 해주는 변환기.  이미지를 생성할 때 우리가 인식가능한 이미지 상태로 이미지를 생성하는 것이 아닌 AI 가 이해하는 잠재적 공간에서 이미지를 생성하는데 그 생성된 잠재적인 이미지를 우리가 실제로 알아볼 수 있는 이미지로 바꿔주는 역할을 한다.  VAE Encorder : 실제 이미지 -> latent image VAE Decorder : latent Image -> 실제 이미지 2. 주요 Checkpoint 모델별 , Encorder, VAE 의 관계 Stable Diffusion (SDXL), Pony 모델 Text Encorder: CLIP 사용 , 이 모델은 단어 단위의 text 를 변환 해 주기 때문에 이 모델을 이용하여 이미지를 생성 할 때는 Prompt 를 단어 단위로 나열하여 입력하는 것이 좋다. 예) masterpiece, best quality, highly detailed, 1girl, solo,  bangs, long hair, slender body,...

왕 초보의 내 컴퓨터에서 이미지 생성하기 - comfyui 설치 및 이미지 생성 기초

 AI를 이용하여 이미지를 생성하는 방법은 온라인에서 생성하는 법 또는 내 컴퓨터에서 마음대로 생성하는 방법이 있다.  온라인으로 생성하는 방법은 chatGPT 나 GEMINI 와 같은 AI 서비스 플랫폼에 가입하여 쉽게 만들 수 있는데, 여기서는 내 컴퓨터에서 내 마음대로 오픈 AI 를 이용하여 생성하는 방법을 설명한다. 이미지를 생성하기 위하여 필요한 것은  이미지 생성 UI 가 필요한데 그것을 먼저 설치하고 필요한 AI 모델을 다운 받아 실제로 이미지 생성을 해 본다. Comfyui 설치.  Qwen 모델로 생성 1. 이미지 생성용 UI ComfyUI  :  가장 많이 쓰이는 고급형 UI 노드 기반 워크플로우 복잡하지만 제어력 최강 SDXL , ControlNet, LoRA, AnimateDiff , Flux, QWEN 등 전부 잘 지원 AUTOMATIC1111 ( Stable Diffusion WebUI ) :  가장 대중적인 UI 웹 브라우저 기반 UI 설치 후 바로 사용하기 쉬움 확장(Extensions) 매우 많음 Fooocus :  초보자 친화형 설정을 거의 안 건드려도 됨 Midjourney 스타일 워크플로우 자동 최적화 중심 본인도 맨처음에 AUTOMATIC1111 을 쓰다고 Comfyui 로 교체하여 지금까지 계속 사용 중이다. 물론 Fooocus 도 사용해 보았지만 ,  개인적으로 추천한다면 무조건 처음부터 Comfyui 를 사용하여 이미지를 생성하기를 권한다. 그래서 여기서는 Comfyui 를 설치하고 이미지 생성을 하는 방법을 설명한다. 2. Comfyui 설치 다운로드 : " https://github.com/Comfy-Org/ComfyUI?tab=readme-ov-file#installing " 에 접속하여 압축파일을 다운로드 접속화면 접속화면에서 " Direct Link to downl...