데이터 및 AI 기업 데이터브릭스(Databricks)가 생성AI 플랫폼 모자이크ML(MosaicML)을 약 13억 달러(약 1조 7천억 원)에 인수하는데 최종 합의했다. 이번 인수를 통해, 양 사는 생성AI 모델에 대한 접근성을 높여 모든 조직이 자체 데이터로 AI 모델을 구축, 소유, 보호할 수 있도록 돕는다는 방침이다.
모자이크ML의 LLM인 ‘MPT-7B’는 공개 이후 330만 건의 다운로드를 기록할 정도로 인기를 끌었으며, 최근에는 새로운 버전인 MPT-30B를 선보이며 기업들이 자체 데이터를 이용해 비용 효율적인 방식으로 AI 모델을 신속하게 구축하고 학습하도록 적극 지원하고 있다. 현재 앨런 AI 연구소(Allen Institute for AI), 제너럴 인텔리전트(Generally Intelligent), 히포크라틱 AI(Hippocratic AI), 리플릿(Replit), 스캐터랩스(Scatter Labs) 등이 모자이크ML의 생성AI 기술을 채택해 활용하고 있다.

데이터브릭스 레이크하우스 플랫폼에 모자이크ML의 기술이 결합되면 높은 비용 부담 없이 가치 있는 데이터에 대한 제어, 보안, 소유권을 효율적으로 유지할 수 있다. 모자이크ML의 모델 학습 자동 최적화 기술은 표준화된 접근방식과 비교해 2배에서 7배 빠른 속도를 지원하며, 선형에 가까운 확장성을 기반으로 수십억 개의 매개변수를 가진 모델을 단 몇 시간 만에 학습시킬 수 있다. 뿐만 아니라, 양 사의 기술이 결합된 플랫폼은 LLM을 훈련시키고 사용하는데 드는 비용을 대폭 절감할 수 있게 해 준다.
이번 인수로 모자이크ML의 연구팀을 포함한 전 직원이 데이터브릭스에 합류하게 된다. 오픈소스 모델인 MPT-30B와 모자이크ML 제품을 구동하는 학습 알고리즘을 개발한 모자이크ML의 ML과 신경망 연구팀은 데이터브릭스에 합류 후에도 모델 학습 효율 개선을 위한 AI 연구를 이어나갈 계획이다.
양 사는 모자이크ML 플랫폼을 꾸준히 확장, 통합함으로써, 조직들이 생성AI 모델을 구축, 소유, 보호할 수 있는 통합 플랫폼을 제공할 예정이다. 이를 통해, 고객들이 자체 모델을 구축하고 그들 고유의 데이터로 모델을 학습하여 차별화된 지적재산(IP)을 창출하도록 도울 계획이다. 한편, 이번 인수는 필요한 규제승인을 포함한 관례적인 거래 종결 조건을 따른다.
알리 고드시(Ali Ghodsi) 데이터브릭스 CEO는 "기업들이 AI가 가져다주는 혜택을 온전히 누리기 위해서는 데이터에 대한 제어권을 확보해야 한다. 데이터브릭스와 모자이크ML은 AI를 보편화하고, 레이크하우스를 생성AI와 LLM 구축에 가장 이상적인 플랫폼으로 발전시키는데 상당한 시너지를 낼 수 있을 것”이라며, “‘투명성’에 중점을 두고 오픈소스 생태계에 기여해 온 양 사의 공통된 비전은 전례없는 컴퓨팅 혁명을 마주하고 있는 우리 고객들에게 더 큰 가치를 제공할 것"이라고 밝혔다.
관련기사
- 데이터브릭스, AI 기반 보안성 높은 애플리케이션 개발 돕는 ‘레이크하우스 앱’ 출시
- 데이터 폭증·복잡성 증가 해결책 ‘데이터옵스’ 부상
- 데이터와 AI 위한 데이터 레이크하우스 조망하는 'Data + AI World Tour'
- “데이터브릭스 레이크하우스, 가장 신뢰할 수 있는 데이터 플랫폼으로 자리잡겠다”
- 신기술로 진화하는 ‘데이터 분석’...뜨거워지는 기업간 경쟁
- 챗GPT와 AI가 소프트웨어와 코딩 산업에 미치는 영향
- 기업용 생성AI 엔진, 기업 데이터 활용성↑
- 기업 AI 활용 돕는 컨설팅 서비스 부상
- AI 도입 가속하는 자동화·데이터 주석·분석 플랫폼 ‘앙고 허브’
- AI 기반 데이터 검색, 데이터레이크 하우스도 결합
