지금까지 스테이블 디퓨전과 모델(플러그인)을 설치하였습니다. 그리고 모델의 세팅, 기본적인 이미지의 생성을 설명하였습니다. 업스케일링, 사이즈, 샘플링, 생성할 이미지의 숫자, 프롬프트의 반영 비중 등을 옵션에서 조정할 수 있습니다. 이번 포스팅은 옵션의 내용을 설명하겠습니다.
기본적인 화면 UI 설명
이전 포스팅에서 간단히 언급하긴 했지만, 기본적인 UI를 다시 한번 설명하고 옵션 설정을 알아보겠습니다. 화면 최상단에서 Checkpoint 모델을 변경할 수 있습니다. Settings 항목을 클릭하면 VAE 선택을 포함한 각종 항목의 설정이 가능합니다. 그 밑으로 텍스트 프롬프트와 네거티브 프롬프트 입력창이 있습니다. 하단에 이번 포스팅에서 설명할 옵션 항목이 있고, 오른쪽에 이미지 생성 창이 있습니다.
옵션 항목
상단의 Generation 항목이 기본 화면입니다. Checkpoint와 Lora 항목을 선택하면 모델 변경이 가능합니다.
Sampling
Sampling method는 이미지를 생성하는 알고리즘을 의미합니다. 속도와 이미지의 세밀함 사이에서 적절한 균형을 찾아 이미지를 생성합니다. 보통 Euler A, 2M Karras, SDE Karras를 많이 이용합니다.
Sampling steps는 이미지를 생성하는 과정에서 수행하는 작업 횟수를 말합니다. 스텝이 높을수록 세밀한 이미지가 생성되지만, 생성 속도가 느려집니다. 그리고 Sampling steps를 너무 높게 설정하면 이미지가 뭉개지거나 깨져서 생성되는 경우가 있습니다. 보통 20~30 정도를 추천합니다.
Width & Height
이미지의 가로 x 세로 비율을 나타냅니다. 처음부터 고해상도로 이미지를 생성하면 속도도 느리고, 많은 이미지를 생성할 수 없습니다. 저해상도로 이미지를 생성하고, 그중에서 마음에 드는 이미지를 선택합니다. 이후 해당 이미지를 업스케일링 하는 방식으로 스테이블 디퓨전을 이용하시길 바랍니다. 이미지의 업스케일링은 상단의 Extras 탭에서 가능합니다. 이미지 사이즈는 보통 512 x 512(기본 사이즈), 512 x 768 또는 768 x 512를 필요에 따라 선택합니다.
Batch count & Batch size
Batch count는 순서대로 이미지를 생성하는 숫자를 의미하고, Batch size는 동시에 생성하는 이미지의 숫자를 말합니다. 보통 동시에 이미지를 생성하는 Batch size를 늘리면 이미지의 품질이 다소 저하된다는 이야기가 있습니다. 최선은 그냥 단일 이미지를 생성하는 것이며, 이미지의 생성 숫자를 늘리고 싶다면 Batch count 숫자를 조정하시길 바랍니다.
CFG scale
이미지가 프롬프트를 얼마나 충실히 반영하는지 나타내는 척도입니다. 수치가 높으면 프롬프트에 부합하는 이미지가 생성됩니다. 반대로 수치가 낮으면 이미지가 프롬프트에서 벗어나, 더 창의적이고 추상적인 이미지가 생성됩니다. 보통 7~9를 적절한 수치라고 합니다.
Seed
Seed 값은 생성한 이미지에 부여된 고유 번호입니다. 기본값은 -1입니다. 만약에 기존 이미지를 참조하여 또 다른 이미지를 생성하고 싶다면, 이미지 생성 창 하단의 Seed 번호를 복사하여 붙여 넣습니다. 혹은 Seed 번호 입력창 우측의 초록색 버튼을 누르면 Seed 번호가 삽입됩니다.
정리
옵션 항목은 정답이 없습니다. A라는 Checkpoint를 사용했을 때는 특정 옵션이 본인이 생각하기에 최적일 수 있습니다. 하지만 B라는 Checkpoint를 사용했을 때는 최적 옵션이 바뀔 수 있기 때문입니다. 여러 모델(Checkpoint/Lora/VAE)을 적용하여 사용해 보고, 옵션을 변경하고, 프롬프트를 수정해 보시길 바랍니다. 시행착오 과정 중에 본인이 생각하는 최적의 이미지를 찾을 수 있을 것입니다.