인공지능 및 머신러닝을 위한 서버리스 API 전문업체인 세그마인드(Segmind)는 이미지 생성 기능을 추가한 SD3(Stable Diffusion 3)를 자사 플랫폼을 통해 제공한다고 발표했다.

세그마인드는 다양한 프로젝트 요구사항을 충족시키기 위해 SD3 라지와 SD3 미디엄을 모두 제공한다.

SD3 라지는 80억 개의 파라미터 수를 보유하며 복잡한 작업을 처리하고 세부적인 시각적 결과물을 생성한다. SD3 라지 텍스트 투 이미지는 물체, 캐릭터, 배경, 조명 및 예술 스타일을 포함하는 상세한 설명에서 탁월한 품질의 이미지를 생성한다.

사이버펑크 세그마인드 고양이
사이버펑크 세그마인드 고양이

여러 주제가 포함된 복잡한 프롬프트를 처리할 수 있으며 철자나 구두점의 작은 변화에도 대응하며, 이전 버전에서 손과 얼굴에 종종 나타나는 아티팩트를 극복한 사진 수준의 이미지를 생성한다. 또한 고도의 정밀도로 생성된 이미지 내에 타이포그래피를 통합했다.

세그마인드는 SD3 라지의 이미지 투 이미지 버전에 대한 액세스도 제공한다. 이를 통해 사용자는 기존 이미지의 색상 수정 및 예술 스타일 적용과 같은 텍스트 프롬프트를 사용하여 이미지를 변환할 수 있다.

SD3 미디엄의 텍스트 투 이미지는 20억 개의 매개변수 수를 가지고 있지만 경계를 초월한 사실적인 이미지 생성 기능을 제공한다. 복잡한 프롬프트를 처리하고, 철자 오류를 처리하며, 예외적인 정밀도로 타이포그래피를 통합한다. 또한 이미지 맞춤화를 위한 미세 조정에 이상적인 작은 매개변수 수를 가지고 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지