기업용 ‘장기 문맥 오픈 AI 모델’…‘고성능·고품질·저지연’ AI 에이전트 개발 최적화

장기 문맥 AI 모델은 긴 텍스트를 이해하고 처리할 수 있는 능력이 있어, 복잡한 데이터 분석, 문서 요약, 다중 단계 추론 등에서 필수적이다. 기존 모델들은 짧은 문맥 창에 제한되었으나, 장기 문맥 모델은 광범위한 정보를 고려해 더 정확하고 일관된 결과를 제공한다. 특히, 방대한 양의 데이터를 다루는 금융, 법률, 의료 등의 분야에서 큰 이점을 제공하며, 문맥을 길게 유지함으로써 일관된 대화와 문서 분석이 가능해진다. 이러한 모델은 효율성과 정확성을 동시에 제공하며, 기업의 생산성을 높이는 데 크게 기여한다.

엔터프라이즈용 AI 시스템 개빌 기업 AI21이 오픈 라이선스에서 사용할 수 있는 가장 큰 256K 토큰 문맥 창을 갖춘 오픈 모델 잠바(Jamba) 1.5 미니(Mini)와 잠바 1.5 라지(Large)를 출시했다. 이 모델들은 뛰어난 성능과 효율성을 자랑하며, 기업에 높은 품질과 저지연 시간을 제공한다.

잠바 모델들은 혁신적인 하이브리드 아키텍처를 통해 트랜스포머(Transformer)와 맘바(Mamba)의 강점을 결합, 기존 모델의 한계를 극복하며 높은 품질과 정확한 응답을 유지하는 동시에, 광범위한 문맥 창에서도 탁월한 효율성을 발휘한다. 잠바 1.5 라지는 3980억 개의 총 파라미터와 940억 개의 활성 파라미터를 가진 MoE(Mixture-of-Experts) 모델로, 복잡한 추론 작업에서 높은 품질과 효율성을 제공한다.

또한 잠바 1.5 미니는 잠바 인스트럭트(Jamba-instruct)의 개선된 버전으로, 확장된 기능과 우수한 출력 품질을 자랑하며, 개발자 친화적으로 설계되어 에이전틱 AI 시스템 구축에 최적화되었다. 이 모델은 함수 호출, 도구 사용, JSON 모드, 구조화된 문서 객체, 인용 모드 등 다양한 기능을 지원한다.

잠바 모델들은 라마(Llama) 8B, 70B와 같은 기존 모델을 능가하는 속도와 효율성을 자랑하며, 룰러(RULER) 벤치마크에서 입증된 바와 같이 문맥 창을 완벽하게 활용한다. 특히, 잠바 1.5 라지는 라마 3.1 70B, 라마 3.1 405B, 미스트랄 라지(Mistral Large) 2와의 비교 테스트에서 가장 낮은 지연 시간을 기록했으며, 큰 문맥 창에서 두 배 이상의 속도를 보여주었다.

AI21은 이번 잠바 모델 출시와 함께 AWS, 구글 클라우드, 마이크로소프트 애저, 스노우플레이크, 데이터브릭스, 엔비디와와 파트너십을 맺고 잠바 모델이 보안된 환경에서 배포되도록 했다. 또한 허깅페이스, 랑체인, LlamIndex, Together.AI에서도 모델을 사용할 수 있게 한다. 또한, 딜로이트(Deloitte)와 협력해 맞춤형 훈련 솔루션을 제공, 엔터프라이즈 시장을 확대하고 있다.

오어 더건(Or Dagan) AI21 제품 부사장은 "AI의 미래는 특히 복잡하고 데이터가 많은 작업에서 광범위한 문맥 창을 진정으로 활용하는 모델에 달려 있다."라며, "잠바 1.5 미니와 라지는 시장에서 가장 긴 문맥 창을 제공하여 LLM 기반 애플리케이션의 가능성을 확장한다."고 말했다.

이채환 기자 whaney@gttkorea.com

기자의 다른기사

상단영역

본문영역

기업용 ‘장기 문맥 오픈 AI 모델’…‘고성능·고품질·저지연’ AI 에이전트 개발 최적화

AI21 기업용 장기 문맥 오픈 AI 모델 ‘잠바 모델 페밀리’ 출

관련기사

본문영역

키워드

관련기사