장기 문맥 AI 모델은 긴 텍스트를 이해하고 처리할 수 있는 능력이 있어, 복잡한 데이터 분석, 문서 요약, 다중 단계 추론 등에서 필수적이다. 기존 모델들은 짧은 문맥 창에 제한되었으나, 장기 문맥 모델은 광범위한 정보를 고려해 더 정확하고 일관된 결과를 제공한다. 특히, 방대한 양의 데이터를 다루는 금융, 법률, 의료 등의 분야에서 큰 이점을 제공하며, 문맥을 길게 유지함으로써 일관된 대화와 문서 분석이 가능해진다. 이러한 모델은 효율성과 정확성을 동시에 제공하며, 기업의 생산성을 높이는 데 크게 기여한다.
엔터프라이즈용 AI 시스템 개빌 기업 AI21이 오픈 라이선스에서 사용할 수 있는 가장 큰 256K 토큰 문맥 창을 갖춘 오픈 모델 잠바(Jamba) 1.5 미니(Mini)와 잠바 1.5 라지(Large)를 출시했다. 이 모델들은 뛰어난 성능과 효율성을 자랑하며, 기업에 높은 품질과 저지연 시간을 제공한다.
잠바 모델들은 혁신적인 하이브리드 아키텍처를 통해 트랜스포머(Transformer)와 맘바(Mamba)의 강점을 결합, 기존 모델의 한계를 극복하며 높은 품질과 정확한 응답을 유지하는 동시에, 광범위한 문맥 창에서도 탁월한 효율성을 발휘한다. 잠바 1.5 라지는 3980억 개의 총 파라미터와 940억 개의 활성 파라미터를 가진 MoE(Mixture-of-Experts) 모델로, 복잡한 추론 작업에서 높은 품질과 효율성을 제공한다.

또한 잠바 1.5 미니는 잠바 인스트럭트(Jamba-instruct)의 개선된 버전으로, 확장된 기능과 우수한 출력 품질을 자랑하며, 개발자 친화적으로 설계되어 에이전틱 AI 시스템 구축에 최적화되었다. 이 모델은 함수 호출, 도구 사용, JSON 모드, 구조화된 문서 객체, 인용 모드 등 다양한 기능을 지원한다.
잠바 모델들은 라마(Llama) 8B, 70B와 같은 기존 모델을 능가하는 속도와 효율성을 자랑하며, 룰러(RULER) 벤치마크에서 입증된 바와 같이 문맥 창을 완벽하게 활용한다. 특히, 잠바 1.5 라지는 라마 3.1 70B, 라마 3.1 405B, 미스트랄 라지(Mistral Large) 2와의 비교 테스트에서 가장 낮은 지연 시간을 기록했으며, 큰 문맥 창에서 두 배 이상의 속도를 보여주었다.
AI21은 이번 잠바 모델 출시와 함께 AWS, 구글 클라우드, 마이크로소프트 애저, 스노우플레이크, 데이터브릭스, 엔비디와와 파트너십을 맺고 잠바 모델이 보안된 환경에서 배포되도록 했다. 또한 허깅페이스, 랑체인, LlamIndex, Together.AI에서도 모델을 사용할 수 있게 한다. 또한, 딜로이트(Deloitte)와 협력해 맞춤형 훈련 솔루션을 제공, 엔터프라이즈 시장을 확대하고 있다.
오어 더건(Or Dagan) AI21 제품 부사장은 "AI의 미래는 특히 복잡하고 데이터가 많은 작업에서 광범위한 문맥 창을 진정으로 활용하는 모델에 달려 있다."라며, "잠바 1.5 미니와 라지는 시장에서 가장 긴 문맥 창을 제공하여 LLM 기반 애플리케이션의 가능성을 확장한다."고 말했다.
관련기사
- 생성AI 도입 급증 ‘보안은 미비’
- 엔비디아, 고해상도 기상 예측 생성AI 모델 '스톰캐스트' 발표
- 확장성·효율성 높은 클라우드 기반 'AI 학습 플랫폼'
- 심각해지는 AI 보안 위협, ‘시큐어 AI 바이 디자인’으로 대비
- 메이머스트, 제조업서 성장하는 ‘AI 통합 서비스’ 시장 다각화 및 확대 박차
- AIoT로 간편해지는 시설 관리...코파일럿 기반 자연어 인터페이스로 쉽고 정확하게
- ‘자율 AI 에이전트’ 부상...생산성·효율성 높이고 비용 줄여
- 고성능 학습 프로그램 구축하는 ‘직관적 AI 도구 모음’
- 40배 빠르고, 1000배 저렴한 ‘AI 기반 추론 엔진’
- 기업 생산성·보안성 높이는 'AWS 생성AI 신규 야심작' 공개
- AI 규제 준수 대비 6대 전략
- 카비랩, 맞춤형 의료 영상 AI 솔루션 식약처 '2등급 인증' 획득
- ‘파리 2024 올림픽’에 알리바바 클라우드 기술이 남긴 감동과 여운
- '토털 AI' 비즈니스 데이터 통합해 AI가 '영업 예측·개인화 마케팅·운영 효율'↑
- CJ올리브네트웍스, ‘AWS 인증’으로 클라우드 보안 역량 강화
- 구글-코리아스타트업포럼, AI 연구 동향·사례 공유하는 ‘리서치앳 코리아’ 개최
- 카테노이드-에쓰핀테크놀로지, ‘MS 클라우드∙AI’ 사업 협력
- 스노우플레이크, 마케팅 컨퍼런스 성료
- AI가 인간 기술자보다 부정맥 감지 ‘14배’ 정확
- 스노우플레이크 통합한 ‘포스포 디시전 클라우드’, AI 활용 간소화·비즈니스 성과↑
- “스노우플레이크의 급성장세, 협업·보안성·신뢰성 기반 '엔터프라이즈 AI'로 이어간다”
- 스노우플레이크-메타, 데이터 클라우드 플랫폼에 LLM 통합해 기업 AI 애플리케이션 구축 지원
- 데이터 클라우드 콘퍼런스 ‘스노우플레이크 월드 투어 서울’ 성료
- 자동화 수요 급증 ‘AI 에이전트’ 연평균 44.8% 기록적 성장
- 클루커스, 데이터브릭스 '데이터 및 AI 거버넌스 파트너상' 2년 연속 수상
- 기대 큰 생성AI, 경영진 관심은 하락세…비즈니스 가치 창출 필요
- 스노우플레이크, 마이크로소프트 파워 플랫폼 전용 커넥터 출시
- 'AI 개발·보안·거버넌스' 강화한 '스노우플레이크 AI 데이터 클라우드 플랫폼'
- AI 에이전트 개발을 쉽고 편하게 ‘그래프릿 에이전트 툴 라이브러리’
- 데이터브릭스-SAP, 비즈니스 데이터 클라우드 통합 협력
- 데이터브릭스-팔란티어, AI 모델 최적화·데이터 거버넌스 강화 협력
