티티닷컴 - ComfyUI + FLUX로 Text to Image 사용법

AI그림

정보ComfyUI + FLUX로 Text to Image 사용법

2액션가면

2025-04-05 17:48:53 수정됨 대한민국

https://tt-dot.com/post/view/1387

cut스크랩

1. FLUX

FLUX는 독일의 Black Forest Labs에서 개발한 텍스트-투-이미지(text-to-image) 생성 모델로, 자연어 프롬프트를 기반으로 고품질의 이미지를 생성하는 데 특화되어 있습니다. FLUX는 다양한 버전으로 제공되며, Schnell 버전은 Apache 2.0 라이선스로 공개되어 개인, 학술, 상업적 용도로 자유롭게 사용할 수 있습니다.

텍스트 표현과 정확한 손 표현이 강점이라고 알려져 있습니다. Stable Diffusion, Stable Diffusion XL 등과 비교하여 고품질의 이미지를 생성할 수 있지만, 고성능 GPU를 필요로 합니다. 일반적으로 FLUX를 구동하기 위해서 12GB이상의 VRAM이 장착된 Nvidia 그래픽 카드가 장착되어 있어야 합니다. 이미지를 생성하는 시간도 일반적인 Stable Diffusion에 비해 평균 2~3배, 혹은 5배까지도 차이가 날 수 있습니다.

FLUX 모델의 버전별 차이는 다음과 같습니다.

FLUX.1 Schnell: 빠른 이미지 생성을 목표로 한 경량화 모델로, Hugging Face에서 다운로드 가능
FLUX.1 Dev: 개발자 및 연구자를 위한 버전으로, 비상업적인 목적으로 사용 가능
FLUX.1 Pro: 상업적 사용을 위한 고급 버전으로, API 형태로 제공되며 라이선스 계약이 필요

아직 Pro는 오픈소스로 풀리지 않았기 때문에, Dev와 Schnell을 사용 목적에 맞게 사용하시면 됩니다.

2. ComfyUI 설치

ComfyUI 설치 방법은 이전 [WAN Image to Video 설명글]에 자세하게 적혀 있습니다.

최신 버전의 Portable 버전을 다운로드 받아 설치하시면 됩니다.

3. 파일 준비

다양한 버전의 FLUX 모델들이 존재하고 있는데, 먼저 FLUX를 이용하기 위해서는 기본 모델 파일, CLIP 모델 파일, VAE 파일 등을 다운받아야 합니다. CLIP 및 VAE를 합친 체크포인트 모델도 존재하지만, 현재 일반적으로 오픈소스 커뮤니티에서 공유되고 있는 형태는 순수 모델 파일을 위주로 배포가 되고 있기 때문에, 모델 파일, CLIP 파일, VAE 파일을 각각 따로 다운로드 받는 것을 권장합니다.

3.1. FLUX 모델 파일

3.1.1. 고성능 GPU 사용 (16GB+ VRAM)

일반적으로 사용할 수 있는 버전은 Schnell 및 Dev 버전입니다. Dev가 Schnell에 비해 품질이 좀 더 좋지만, 더욱 고성능 GPU를 요구하며 상업적으로 사용이 불가합니다.

공식 UNET 모델 파일은 Schnell 버전은 [이곳]에서 다운로드 하시면 되며, Dev 버전은 [이곳]에서 다운로드 가능합니다.

(Dev 버전은 파일에 바로 액세스가 불가능하여 해당 링크로 진입 후 flux1-dev.safetensors 파일을 직접 다운로드 받으면 됩니다.)

3.1.2. 그 외의 일반 성능 GPU

위 공식 모델 파일들은 16GB 이상의 VRAM이 장착된 고성능 GPU에서만 동작이 가능합니다.

따라서, 하이엔드 GPU를 사용하지 않고 있다면 경량화 버전의 모델을 사용해야 합니다. Civitai, 허깅페이스 등에서 다양한 FLUX 기반 병합 fp8 또는 양자화 모델(GGUF 플러그인 별도 필요)들이 배포 중입니다. fp16 기본 모델보다 이런 경량화 된 모델이나 양자화 모델을 사용하는것을 추천합니다.

ComfyUI에서 fp8 모델에 CLIP 및 VAE를 포함한 체크포인트 모델을 공유 중이긴 합니다. 하지만, 위에 설명한 바와 같이 AI 모델 공유 사이트에서 배포중인 여러 모델들은 CLIP이나 VAE가 포함되 않은 모델들이 많기 때문에 추천하지 않습니다.

다운로드 받은 모델 파일은 ComfyUI 설치된 폴더기준으로 ComfyUI/models/diffusion_models 폴더에 넣어줍니다.

3.2. CLIP 파일

CLIP 파일은 일단 두 가지가 필요합니다. t5xxl_fp16.safetensors 파일과 clip_l.safetensors 파일입니다.

두 파일 모두 [이곳] 에서 다운로드 가능합니다.

다운로드 받은 파일은 ComfyUI가 설치된 폴더기준으로 ComfyUI/models/text_encoders 폴더에 넣어줍니다.

PC에 설치된 메모리(VRAM + RAM)가 32GB 미만이라면, t5xxl_fp8_e4m3fn.safetensors 파일을 사용하시기 바랍니다.

3.3. VAE 파일

VAE파일도 공식 파일이 존재해서 [이곳]에서 다운로드 가능합니다.

ComfyUI 설치 폴더 기준, ComfyUI/models/vae 폴더에 넣어줍니다.

4. 사용하기

4.1. ComfyUI 실행

윈도우에서 명령프롬프트를 열고 ComfyUI 설치 폴더로 이동하여 에서 run_nvidia_gpu.bat 파일을 실행합니다.

4.2. Workflow 불러오기

FLUX를 이용해 Text to Image를 보다 편리하게 이용할 수 있도록 Workflow를 작성해 두었습니다. LoRA 및 Upscale 까지 이용이 가능하도록 구성되어 있으며, 기본 적으로 이 기능들은 Bypass (우회) 하도록 설정되어 있습니다. 원하시는 경우 우회를 해제하여 사용하실 수 있습니다.

Workflow 파일은 [이곳]에서 다운로드 가능합니다.