Lucataco가 Replicate에 올린 Demofusion 모델 초보자 가이드
Source: Dev.to

이 가이드는 Demofusion이라는 AI 모델에 대한 간략한 안내이며, 해당 모델은 Lucataco가 관리합니다. 이런 분석이 마음에 든다면 AImodels.fyi에 가입하거나 Twitter에서 팔로우하세요.
Model overview
DemoFusion은 PRIS‑CV 팀이 개발한 고해상도 이미지 생성 모델로, 제작자 lucataco가 이끌고 있습니다. 이 모델은 큰 재정적 자원 없이도 강력한 이미지 생성 기능에 대한 접근성을 민주화하기 위해 설계되었습니다. DemoFusion은 open‑dalle‑v1.1, pasd‑magnify, playground‑v2, pixart‑lcm‑xl‑2, 그리고 pixart‑xl‑2와 같은 모델들의 강점을 기반으로 하며, 뛰어난 프롬프트 충실도와 의미 이해력을 보여줍니다.
Model inputs and outputs
DemoFusion은 텍스트 프롬프트와 다양한 파라미터를 받아 이미지 를 생성하는 텍스트‑투‑이미지 모델입니다. 최대 3072 × 3072 픽셀의 고해상도 이미지를 생성할 수 있어 다양한 용도에 적합합니다.
Inputs
- Prompt – 원하는 이미지를 설명하는 텍스트.
- Negative Prompt – 피하고 싶은 요소를 지정하는 텍스트.
- Width – 출력 이미지의 가로 픽셀 수.
- Height – 출력 이미지의 세로 픽셀 수.
- Num Inference Steps – 디노이징 단계 수.
- Guidance Scale – 프롬프트와 모델 자체 생성 간의 균형을 조절하는 값 (classifier‑free guidance).
- View Batch Size – 여러 디노이징 경로를 위한 배치 크기.
- Stride – 로컬 패치를 이동시키는 스트라이드.
- Multi Decoder – 다중 디코더 사용 여부를 나타내는 불리언 플래그.
- Cosine Scale 1 – 스킵‑레지듀얼 강도.
- Cosine Scale 2 – 팽창 샘플링 강도.
- Cosine Scale 3 – 가우시안 필터 강도.
- Seed – 결과를 재현 가능하게 만드는 랜덤 시드.
Outputs
- Output Images – 제공된 프롬프트와 파라미터에 따라 생성된 고해상도 이미지들.
Capabilities
DemoFusion은 뛰어난 프롬프트 충실도, 의미 이해력, 그리고 다양한 주제와 스타일에 걸쳐 고품질·고해상도 이미지를 생성하는 능력을 보여줍니다.