AI의 열풍 속에서 많은 조직들이 AI 도입을 통해 복잡한 데이터의 분석은 물론이고 비즈니스 프로세스의 자동화를 통해 생산성을 향상시켜 나갈 수 있을 것으로 기대하고 있다.

그리고 이런 기대감은 AI 도입 열풍으로 이어지고 있으며, AI 도입과 적용에서 뒤쳐지는 것이 바로 시장 경쟁력에서 뒤쳐지는 것이라는 위기감 속에서 AI 도입에 속도를 내고 있다.

하지만, AI 도입은 데이터 준비 과정에서부터 컴퓨팅 인프라 구축, 모델 선정과 구축은 물론이고 AI 학습, 그리고 실제적인 개발과 운영에 이르는 각 과정마다 전문화된 도구와 솔루션을 이용해야 하며, 이들을 유기적으로 연결하고 연동하는 작업부터 문제를 겪고 있다. 특히 이런 과정에서 많은 비용과 시간이 들고, 해당 분야의 전문 인력까지 확보해야 하기에 어려움이 가중될 뿐이다.

이런 문제를 해결하기 위한 방안으로, 등장한 MLOps는 머신러닝 개발자들이 AI 모델 개발과 운영을 좀 더 빠르고, 쉽고, 비용 효율적으로 수행할 수 있도록 돕는다는 점에서 많은 기대를 모으고 있다.

데이터 수집과 준비 과정에서 AI 모델 개발, 배포, 운영하는 전 과정에 대한 툴과 인프라를 모두 제공하는 엔드 투 엔드 MLOps 플랫폼을 제공하는 베슬에이아이(Vessl AI)는 지금까지 데브옵스가 소프트웨어 개발 분야의 혁신을 이끌어 온 것처럼, MLOps가 AI 시대의 소프트웨어 개발에 혁신을 가져올 수 있을 것이라 믿고 있다. 게다가 베슬에아이의 기술은 국내를 넘어 해외에도 주목 받고 있어 글로벌에서도 자신감이 높다.

안재만 베슬에이아이 대표를 만나 베슬에이아이의 MLOps 플랫폼이 어떻게 고객들의 AI 도입과 운영을 돕는지, 그리고 향후 AI 분야에서 MLOps가 갖는 중요성 등에 대해 들어봤다.

안재만 베슬에이아 대표
안재만 베슬에이아 대표

조직들이 AI 도입에서 가장 크게 겪는 어려움은?

조직들은 AI 인프라 구축, 데이터 관리, 모델 학습, 배포의 복잡성 등 여러 어려움에 직면하고 있다. 이런 어려움을 MLOps는 기존의 ML 개발 프로세스를 표준화하고 자동화해, 조직들이 AI 모델을 더 빠르고 안정적으로 개발, 배포, 모니터링할 수 있게 도와준다. 이를 통해 조직들은 인프라 혹은 엔지니어링의 문제에 소요되는 시간을 줄이고, 실제 비즈니스 문제에 집중할 수 있다.

베슬에이아이는 AI개발 전주기를 지원하는 MLOps 플랫폼을 제공하고 있다. 조직들은 복잡한 인프라를 구축하고 다양한 툴을 연동하기 위한 작업 없이, 간단한 인터페이스를 통해 AI 개발과 운영 과정을 처리할 수 있다.

베슬에이아이 MLOps 플랫폼의 특징은?

베슬 플랫폼(VESSL Platform)은 크게 런(Run), 파이프라인(Pipeline), 아티팩트(Artifact) 등 3가지로 구성돼 있으며, 데이터 전처리부터 모델 학습과 배포까지의 전주기를 지원하는 엔드투엔드 솔루션이다.

‘런’은 개발자가 클라우드나 인프라에 대한 고민 없이, 머신러닝 학습과 배포를 하나의 인터페이스에서 수초만에 실행할 수 있도록 돕는다. ‘파이프라인’은 데이터 전처리, 모델 학습, 배포 등의 일련의 과정을 자동화하고, ‘아티팩트’는 AI모델 운영 과정에서의 데이터, 모델, 프로젝트 현황, 클러스터 상태 등을 하나의 대시보드에서 확인할 수 있도록 돕는다.

베슬에이아이는 다양한 산업군의 스타트업부터 대기업까지 다양한 규모의 조직들이 AI를 비즈니스에 적용할 때 각 고객 맞춤형으로 지원하고 있다.

예를 들어 AI 스타트업은 멀티클라우드를 구축해 저렴한 GPU 클라우드를 자동으로 찾아 사용할 수 있어 GPU 비용을 크게 절감하게 한다. 중견기업에게는 즉시 사용할 수 있는 AI 모델을 제공해 빠르게 AI 모델을 자사의 비즈니스에서 테스트할 수 있게 한다. 대기업에게는 복잡한 AI 개발 과정을 자동화해 개발과 운영과정에서의 비효율을 제거, 그에 따른 시간과 비용을 절감시켜 준다.

주요 고객과 타킷 시장은?

현재 현대자동차, 티맵모빌리티, KAIST, 서울대 공과대학교, 스캐터랩, 뤼튼 등 국내 주요 기업과 연구소의 AI 팀이 사용하고 있으며, 시간과 비용, 안정적인 운영 편의성 측면에서 도움을 주고 있다.

우선 시간 측면에서는 인프라 설정이나 자동화 파이프라인을 통해 AI 모델 개발까지 걸리는 시간을 80% 이상 단축할 수 있으며, 비용 측면에서는 멀티클라우드 등의 전략을 통해 컴퓨팅 비용을 70% 이상 절감할 수 있다. 또한 AI 모델 성능에 대한 모니터링을 제공해 모델 이상 탐지가 가능해, 엔터프라이즈 급 트래픽이 들어오는 환경에서 안정적인 AI 모델 운영을 돕는다.

베슬에이아이는 다양한 산업의 AI 사용 조직을 대상으로 하고 있다. 고객들의 만족도도 높아, 기존 사용자들의 추천이나 소개를 통해 지속적으로 고객들이 유입되고 있는 상황이다. 그리고 이렇게 확보된 고객들은 다양한 분야에서 사용 시나리오를 확보해 나가고 있다. 특히 자율주행, 생성AI 등 각 분야별 최고의 고객들의 사례를 성공적으로 구축해가고 있다.

국내뿐 아니라 미국과 같은 해외에서도 빠른 시장 진입을 목표로 할 수 있는 환경을 조성하고 있다.

AI로 인한 다양한 문제는 어떻게 해결하나?

베슬 플랫폼은 조직의 내부 인프라에서 직접 생성AI 모델, LLM을 운영할 수 있도록 지원하며, 외부와 분리된 환경에서 사내 데이터를 기반으로 LLM 모델을 학습할 수 있도록 제공하고 있어 보안이나 데이터 유출 문제를 근본적으로 방지할 수 있다.

또한 데이터 편향이나 거버넌스를 관리할 수 있도록 자동 데이터 전처리와 LLM 플로우(Flow)을 제공함으로써 LLMOps의 영역에서도 활용할 수 있다.

향후 계획은?

생성AI 시장이 빠른 속도로 성장함에 따라, 최근에는 특히 생성AI 분야의 고객 확보에 집중하고 있다. 이를 위해 LLM 학습과 파인튜닝에 필요한 인프라 지원은 물론이고 멀티클라우드를 통한 비용 최적화된 GPU 확보 등에 집중하고 있다.

또한, 우리의 기술이 주목받고 있는 미국 시장 진출에 적극 나서고 있다. NeurIPS, CVPR 등 대표적인 AI 컨퍼런스에 참가하고 각종 이벤트 주최, 구글 등의 기업과의 파트너십 등을 추진하고 있다.

저작권자 © 지티티코리아 무단전재 및 재배포 금지